تعاون معهد ألين للذكاء الاصطناعي مع عدد من الجامعات لإصدار أول نموذج لغة واسع النطاق مفتوح المصدر بالكامل في العالم OLMo. ويمثل هذا معلما هاما في مجال الذكاء الاصطناعي وسيعزز تطوير تكنولوجيا نموذجية كبيرة أكثر شفافية وانفتاحا. يتضمن OLMo أوزان النماذج والتعليمات البرمجية ومجموعات البيانات وعملية تدريب كاملة، ويعمل إصدار المعلمة 7B الخاص به بشكل جيد في مهام متعددة. بالإضافة إلى ذلك، كشف فريق البحث أيضًا عن مجموعة بيانات ما قبل التدريب Dolma وقدم أدوات تجميع وتحليل البيانات لتحقيق أقصى قدر من شفافية البيانات، والتي لها أهمية بعيدة المدى لتعزيز البحث وتطبيق نماذج اللغات الكبيرة في الأوساط الأكاديمية والصناعة.
أصدر معهد ألين للذكاء الاصطناعي والعديد من الجامعات أول نموذج كبير مفتوح المصدر بنسبة 100% في العالم OLMo، بما في ذلك الأوزان والرموز ومجموعات البيانات وعملية التدريب بأكملها. يُظهر تقييم الأداء أن OLMo-7B يتفوق قليلاً في العديد من المهام. وفي الوقت نفسه، كشف الباحثون عن مجموعة بيانات ما قبل التدريب Dolma لتعزيز البحث المفتوح في مجال التدريب المسبق لنموذج اللغة. وفيما يتعلق بشفافية البيانات، يتم توفير أدوات جمع البيانات وأدوات التحليل.
لا يؤدي إصدار OLMo مفتوح المصدر إلى خفض عتبة أبحاث النماذج الكبيرة فحسب، بل يساهم أيضًا بموارد قيمة لمجتمع الذكاء الاصطناعي العالمي، مما يبشر بوصول نظام بيئي أكثر انفتاحًا وتعاونًا للذكاء الاصطناعي. في المستقبل، من المتوقع أن نرى المزيد من التطبيقات المبتكرة ونتائج الأبحاث المستندة إلى OLMo الناشئة.