تم إصدار نموذج لغة Teuken-7B: اختراق هيمنة اللغة الإنجليزية ودعم 24 لغة رسمية للاتحاد الأوروبي

الكاتب：Eve Cole وقت التحديث：2024-11-30 16:10:01

علم محرر Downcodes أنه تم إصدار نموذج لغة مكون من 7 مليارات معلمة يسمى Teuken-7B على منصة Hugging Face، ويدعم جميع اللغات الرسمية للاتحاد الأوروبي البالغ عددها 24 لغة. تم تطوير النموذج بواسطة مشروع بحث EU OpenGPT-X وهو متاح للمستخدمين كمصدر مفتوح. على عكس معظم نماذج لغات الذكاء الاصطناعي التي تركز على اللغة الإنجليزية، تم بناء Teuken-7B من الصفر، حيث يأتي ما يقرب من نصف بيانات التدريب الخاصة به من لغات أوروبية غير الإنجليزية، مما يمنحه ميزة كبيرة في التعامل مع لغات أوروبية متعددة.

Teuken-7B، وهو نموذج لغة يحتوي على 7 مليارات معلمة، متوفر الآن على Hugging Face ويدعم جميع لغات الاتحاد الأوروبي الرسمية البالغ عددها 24 لغة. تم تطوير النموذج بواسطة مشروع بحث EU OpenGPT-X وهو متاح للمستخدمين كمشروع مفتوح المصدر. على عكس معظم نماذج لغة الذكاء الاصطناعي التي تركز على اللغة الإنجليزية، تم بناء Teuken-7B من الصفر، حيث يأتي حوالي نصف بيانات التدريب الخاصة به من لغات أوروبية غير الإنجليزية.

ملاحظة لمصدر الصورة: تم إنشاء الصورة بواسطة الذكاء الاصطناعي، والصورة معتمدة من قبل مزود الخدمة Midjourney

ويقول فريق التطوير إن أداء Teuken-7B جيد في جميع اللغات التي تم التدريب عليها، كما أن موثوقيته مثيرة للإعجاب بشكل خاص عند التعامل مع لغات غير الإنجليزية. لقياس أداء نماذج اللغة في اللغات الأوروبية، أنشأ فريق المشروع أيضًا تصنيفًا أوروبيًا جديدًا لماجستير اللغة الإنجليزية، متجاوزًا طرق الاختبار القياسية السابقة التي كانت تعتمد بشكل أساسي على اللغة الإنجليزية.

يمثل هذا الإصدار خطوة مهمة إلى الأمام في دفع أوروبا لنماذج الذكاء الاصطناعي متعددة اللغات، مع تزويد المطورين أيضًا بأداة قوية ومتنوعة لدعم التطبيقات والأبحاث عبر اللغات.

يوفر الإصدار مفتوح المصدر لـTeuken-7B إمكانيات جديدة في مجال الذكاء الاصطناعي متعدد اللغات ويعكس الجهود النشطة التي تبذلها أوروبا في البحث المستقل وتطوير تكنولوجيا الذكاء الاصطناعي. ستوفر قدرات المعالجة الممتازة متعددة اللغات مزيدًا من الراحة للمطورين العالميين وتعزز التطوير النشط للتطبيقات عبر اللغات. ومن المتوقع أن يلعب Teuken-7B دورًا في المزيد من المجالات في المستقبل.