(SeaPRwire) – بوسطن، ماساتشوستس – 23/03/2026 – (SeaPRwire) – أطلقت Modulate واجهة برمجة تطبيقات جديدة لتحويل الكلام إلى نص تهدف إلى إعادة تشكيل كيفية معالجة المؤسسات للصوت الحواري وفهمه على نطاق واسع. تم وضع Velma Transcribe، الذي تم إطلاقه حديثًا، كحل نسخ فعال من حيث التكلفة وعالي الأداء مصمم لتلبية الطلب المتزايد على تحليل بيانات الصوت في الوقت الفعلي عبر الصناعات، من خدمة العملاء إلى المنصات الاجتماعية والتطبيقات المدفوعة بالذكاء الاصطناعي.
يسلط الإصدار الضوء على تحول أوسع في الصناعة نحو جعل البنية التحتية لذكاء الصوت أكثر سهولة وجدوى اقتصاديًا. من خلال خفض حاجز التكلفة للنسخ بشكل كبير، يتيح أحدث عروض Modulate للمؤسسات توسيع استخدام بيانات الصوت عبر مجموعة واسعة من التطبيقات، بما في ذلك وكلاء الصوت في الوقت الفعلي، وخطوط أنابيب التحليلات، ومنصات الاتصالات العالمية.
تم بناء Velma Transcribe على نموذج الاستماع الجماعي (ELM) الخاص بـ Modulate، وهو نهج قائم على البحث ينسق نماذج نسخ متخصصة متعددة لتحسين الأداء. تعمل هذه البنية الجماعية على تحسين دقة النسخ، وتقليل زمن الاستجابة، وتعزيز الكفاءة من حيث التكلفة مقارنة بالأنظمة التقليدية ذات النموذج الواحد. أظهرت المنصة أداءً قويًا على المعايير المعترف بها على نطاق واسع مثل Earnings-22 و AMI Meeting Corpus، لا سيما في التعامل مع سيناريوهات المحادثات المعقدة والمتعددة المتحدثين.
يؤكد مسؤولو الشركة أن الحل يتجاوز قدرات النسخ التقليدية. بينما تركز العديد من الأنظمة فقط على تحويل الكلام إلى نص، يدمج Velma Transcribe فهمًا سياقيًا أعمق، ويدعم مجموعة أوسع من رؤى المحادثة. في الوقت نفسه، تم تصميم واجهة برمجة التطبيقات لتظل متاحة للمطورين الذين يحتاجون إلى نصوص سريعة وموثوقة دون عبء تحليلي إضافي.
بالإضافة إلى قدرات النسخ الخاصة بها، تتضمن المنصة مجموعة من الميزات التي تركز على المؤسسات، بما في ذلك اكتشاف المشاعر عبر أكثر من 20 فئة، والتعرف على اللهجات التي تغطي أكثر من 20 تنوعًا، ودعم متعدد اللغات يغطي أكثر من 70 لغة. كما أنها تتضمن وظائف متقدمة مثل تحديد المتحدث، واكتشاف المعلومات التعريف الشخصية (PII) وإخفائها، ودعم البث في الوقت الفعلي للتطبيقات المباشرة.
أحد أبرز جوانب Velma Transcribe هو نموذج التسعير الخاص به. مع انخفاض تكاليف النسخ إلى حوالي 0.03 دولار للساعة من الصوت، تقدم المنصة تخفيضًا كبيرًا مقارنة بأسعار السوق السائدة. يتيح هيكل التسعير هذا للمؤسسات معالجة كميات كبيرة من بيانات الصوت بشكل اقتصادي، مما يفتح فرصًا جديدة لاتخاذ القرارات المستندة إلى البيانات واستراتيجيات تحقيق الدخل.
تم تصميم النظام لأداء موثوق به في بيئات المحادثة الواقعية، حيث غالبًا ما يشكل الكلام المتداخل، والمقاطعات، واللهجات المتنوعة، والضوضاء الخلفية تحديًا لأدوات النسخ التقليدية. تشير نتائج المعايير إلى أن Velma Transcribe يقلل بشكل كبير من معدلات الخطأ مقارنة بالعديد من الحلول الراسخة، مما يعزز ملاءمته للنشر على نطاق المؤسسات.
لدعم التطبيقات ذات الإنتاجية العالية، تتضمن المنصة ميزات مثل نقاط نهاية النسخ المجمعة والمتدفقة، والمخرجات المنظمة مع الطوابع الزمنية، وزمن استجابة أقل من ثانية لحالات الاستخدام المباشرة، وسياسة عدم الاحتفاظ بالبيانات المصممة لتعزيز الخصوصية والامتثال. مدعومة بممارسات أمنية معتمدة من ISO 27001، تضع هذه القدرات الحل للنشر الآمن في البيئات المنظمة والحساسة للبيانات.
Velma Transcribe هو جزء من مجموعة Velma 2.0 الأوسع من نماذج ذكاء الصوت الخاصة بـ Modulate، والتي تهدف إلى تزويد أنظمة الذكاء الاصطناعي بـ “طبقة استماع” أكثر تقدمًا. يمكّن هذا النهج المؤسسات من تجاوز النسخ البسيط نحو فهم أعمق للمحادثة، ودعم حالات الاستخدام مثل اكتشاف الاحتيال، وتحليل المشاعر، ومراقبة الامتثال، ورؤى التشغيل في الوقت الفعلي.
الحل متاح على الفور، مع تسعير يعتمد على الاستخدام مصمم لاستيعاب عمليات النشر الصغيرة وأعباء عمل المؤسسات ذات الحجم الكبير.
حول Modulate
Modulate هي شركة تقنية لذكاء الصوت تركز على تطوير نماذج وواجهات برمجة تطبيقات للذكاء الاصطناعي تمكّن الفهم القابل للتطوير للصوت الحواري في العالم الحقيقي. تجمع حلولها بين التعرف على الكلام، والتحليل الصوتي، والمعالجة السياقية لتقديم ذكاء صوتي دقيق وقابل للتفسير وفعال من حيث التكلفة للمؤسسات والمطورين.
يتم توفير المقال من قبل مزود محتوى خارجي. لا تقدم SeaPRwire (https://www.seaprwire.com/) أي ضمانات أو تصريحات فيما يتعلق بذلك.
القطاعات: العنوان الرئيسي، الأخبار اليومية
يوفر SeaPRwire تداول بيانات صحفية في الوقت الفعلي للشركات والمؤسسات، مع الوصول إلى أكثر من 6500 متجر إعلامي و 86000 محرر وصحفي، و3.5 مليون سطح مكتب احترافي في 90 دولة. يدعم SeaPRwire توزيع البيانات الصحفية باللغات الإنجليزية والكورية واليابانية والعربية والصينية المبسطة والصينية التقليدية والفيتنامية والتايلندية والإندونيسية والملايو والألمانية والروسية والفرنسية والإسبانية والبرتغالية ولغات أخرى.