أعلنت Meta مؤخرًا عن تعاون مع اليونسكو لإطلاق برنامج شريك في تكنولوجيا اللغة يهدف إلى تعزيز تطوير الذكاء الاصطناعي (AI). يركز البرنامج على وجه التحديد على لغات الأقليات العرقية ويهدف إلى دعم تقنيات الذكاء الاصطناعي مفتوح المصدر المستقبلي من خلال جمع التسجيلات الصوتية والسجلات النصية.
أعلنت META مؤخرًا عن برنامج شراكة جديدة لتكنولوجيا اللغة بالشراكة مع اليونسكو لجمع التسجيلات الصوتية والسجلات النصية بلغات متعددة لدفع الذكاء الاصطناعي المفتوح والمتاح في المستقبل. يركز هذا البرنامج على لغات الأقليات التي يتم تجاهلها في البيئة الرقمية.
وفقًا لـ Meta ، يأمل البرنامج في جذب الشركاء ، وتوفير أكثر من 10 ساعات من التسجيلات الصوتية والنسخ ، والنصوص المكتوبة الغنية ، ومجموعة من الجمل المترجمة. وتأمل Meta في دمج هذه اللغات في نموذج التعرف على الكلام وترجمة AI من خلال الجهود المشتركة مع شركائها ، والنتائج التي سيتم إصدارها في النهاية في المصدر المفتوح.
اعتبارا من الآن ، من بين الشركاء المؤكدين حكومة نونافوت الإقليمية في شمال كندا ، حيث يستخدم بعض سكان المنطقة لغة تسمى الإنويت. قال ميتا في مدونتها: "تركز جهودنا على وجه التحديد على اللغات المحرومة لدعم عمل اليونسكو. "
لاستكمال هذه الخطة ، ستقوم Meta أيضًا بإصدار معيار ترجمة آلي مفتوح المصدر مصمم لتقييم أداء نماذج ترجمة اللغة. هذا المعيار الذي صممه اللغويون ، يدعم سبع لغات ويمكن الوصول إليه ويساهم به من خلال منصة تطوير الذكاء الاصطناعى.
ترى Meta كلا المبادرتين كإجراءات خيرية ، لكن الشركة ستستفيد أيضًا من ترقية نماذج التعرف على الصوت والترجمة. تستمر Meta في توسيع عدد اللغات التي يدعمها مساعد AI ، Meta AI ، واختبارات ، على سبيل المثال ، ميزات الترجمة الصوتية في بكرات Instagram ، مما يسمح للمبدعين بصياغة أصواتهم وتزامنها تلقائيًا.
على الرغم من أن جهود META في معالجة اللغة تستحق الاهتمام ، إلا أن الشركة تلقت الكثير من الانتقادات لمعالجة المحتوى غير الإنجليزي. تشير التقارير إلى أنه عندما يتعامل Facebook مع معلومات مضللة Covid-19 باللغة الإيطالية والإسبانية ، فإن ما يقرب من 70 ٪ من المحتوى غير محدد ، في حين أن المحتوى الإنجليزي هو 29 ٪ فقط. بالإضافة إلى ذلك ، تُظهر الوثائق التي تم تسريبها أن المحتوى العربي غالبًا ما يتم تسميته كخطاب الكراهية. وقال ميتا إنه يتم اتخاذ الخطوات لتحسين تقنية ترجمتها ومراجعة المحتوى لمعالجة هذه التحديات.
لا يعزز برنامج التعريف هذا تطوير تكنولوجيا الذكاء الاصطناعي فحسب ، بل يقدم أيضًا مساهمة مهمة في حماية تنوع اللغة العالمية.