يمكن اعتبار أحدث سلسلة من نماذج ترجمة الكلام للاتصالات السلسة التي أصدرتها شركة Meta إنجازًا كبيرًا في مجال ترجمة الكلام. تتضمن هذه السلسلة أربعة نماذج تدعم ترجمة الكلام في الوقت الفعلي بما يقرب من مائة لغة، مع تأخير حوالي ثانيتين فقط، ويمكنها استعادة النغمة والسرعة والتفاصيل الأخرى للكلام المصدر بشكل كبير، مما يجعل تأثير الترجمة واقعيًا وطبيعيًا . لا تُظهر خطوة Meta مكانتها الرائدة في مجال الذكاء الاصطناعي فحسب، بل توفر أيضًا راحة غير مسبوقة للاتصالات العالمية.
أصدرت شركة Meta مؤخرًا سلسلة Seamless Communication، وهي نموذج جديد لترجمة الكلام، تتضمن 4 نماذج تدعم ترجمة الكلام في الوقت الفعلي بين ما يقرب من 100 لغة، مع إمكانية التحكم في التأخير بحوالي 2 ثانية. يمكن للنموذج إعادة إنتاج ميزات معقدة مثل التوقف المؤقت والنغمة وسرعة التحدث للكلام المصدر، مما يجعل الترجمة أكثر واقعية. تم اعتماد بنية غير انحدارية لدعم ترجمة التسلسل الطويل. بالإضافة إلى ذلك، قامت Meta بفتح النموذج وأكبر مجموعة كلامية تبلغ 585000 ساعة، وأضافت وظائف مثل العلامة المائية الصوتية وتخفيف سمية الترجمة لمنع إساءة استخدام النموذج.
سيعمل نموذج ميتا مفتوح المصدر ومجموعته الضخمة على تعزيز تطوير تكنولوجيا ترجمة الكلام بشكل كبير وتعزيز تبادل المعلومات على مستوى العالم، وفي الوقت نفسه، تعكس إجراءات مكافحة إساءة الاستخدام أيضًا الشعور بالمسؤولية في تطبيق التكنولوجيا. ونحن نتطلع إلى سلسلة الاتصالات السلسة التي ستجلب المزيد من المفاجآت في المستقبل.