لقد كان مجال الذكاء الاصطناعي مفتوح المصدر محدودًا منذ فترة طويلة بسبب المزايا التي تتمتع بها شركات التكنولوجيا الكبرى في مجال القدرة الحاسوبية وتكنولوجيا ما بعد التدريب. ومع ذلك، فإن برنامج ما بعد التدريب Tülu3 الذي أطلقته AI2 (معهد ألين للذكاء الاصطناعي سابقًا) يحاول تغيير هذا الوضع. يوفر Tülu3 عملية ما بعد التدريب كاملة وقابلة للتخصيص، مما يسمح للمستخدمين بتعديل قدرات النموذج وفقًا للاحتياجات، وفي النهاية تحقيق التطبيق الفعال للنموذج في مجالات محددة. ولا يؤدي هذا التقدم التكنولوجي إلى خفض عتبة تطبيق الذكاء الاصطناعي مفتوح المصدر فحسب، بل يزود الشركات والمؤسسات أيضا بخيارات أكثر استقلالية وقابلية للتحكم، وخاصة في المجالات التي تنطوي على معالجة البيانات الحساسة، مثل البحوث الطبية.
في مجال الذكاء الاصطناعي مفتوح المصدر، لا تنعكس الفجوة مع شركات التكنولوجيا الكبرى فقط في قوة الحوسبة. يعمل AI2 (معهد ألين للذكاء الاصطناعي سابقًا) على سد هذه الفجوة من خلال سلسلة من المبادرات الرائدة. إن برنامج ما بعد التدريب Tülu3 الذي تم إصداره حديثًا يجعل من الممكن تحويل نماذج اللغة الكبيرة "الأصلية" إلى أنظمة ذكاء اصطناعي عملية.
على عكس الإدراك الشائع، لا يمكن استخدام نماذج اللغة الأساسية مباشرة بعد التدريب المسبق. وفي الواقع، فإن عملية ما بعد التدريب هي الرابط الرئيسي الذي يحدد القيمة النهائية للنموذج. وفي هذه المرحلة يتحول النموذج من شبكة "تعرف كل شيء" ولكنها تفتقر إلى الحكم، إلى أداة عملية ذات توجه وظيفي محدد.
لفترة طويلة، كانت الشركات الكبرى تلتزم السرية بشأن برامج ما بعد التدريب. في حين أنه يمكن لأي شخص بناء نموذج باستخدام أحدث التقنيات، إلا أن تقنيات ما بعد التدريب الفريدة مطلوبة لجعل النموذج مفيدًا في مجالات محددة، مثل الاستشارة النفسية أو تحليل الأبحاث. حتى بالنسبة لمشاريع مثل Meta's Llama، والتي يتم الإعلان عنها على أنها "مفتوحة المصدر"، فإن مصدر نموذجها الأصلي وطرق التدريب الشائعة لا تزال سرية تمامًا.
ظهور Tülu3 يغير هذا الوضع. تغطي هذه المجموعة الكاملة من حلول ما بعد التدريب نطاقًا كاملاً من العمليات بدءًا من اختيار الموضوع وحتى إدارة البيانات، ومن التعلم المعزز إلى الضبط الدقيق. يمكن للمستخدمين ضبط قدرات النموذج وفقًا لاحتياجاتهم، مثل تعزيز قدرات الرياضيات والبرمجة، أو تقليل أولوية المعالجة متعددة اللغات.
يُظهر اختبار AI2 أن أداء النموذج الذي تم تدريبه بواسطة Tülu3 قد وصل إلى مستوى أعلى النماذج مفتوحة المصدر. يعد هذا الإنجاز مهمًا: فهو يوفر للشركات خيارًا مستقلاً تمامًا ويمكن التحكم فيه. خاصة بالنسبة للمؤسسات التي تتعامل مع البيانات الحساسة، مثل الأبحاث الطبية، لم تعد بحاجة إلى الاعتماد على واجهات برمجة التطبيقات التابعة لجهات خارجية أو الخدمات المخصصة، حيث يمكنها إكمال عملية التدريب بأكملها محليًا، مما يوفر التكاليف ويحمي الخصوصية.
لم تقم شركة AI2 بإصدار هذا الحل فحسب، بل أخذت أيضًا زمام المبادرة في تطبيقه على منتجاتها الخاصة. على الرغم من أن نتائج الاختبار الحالية تعتمد على نموذج Llama، إلا أن لديهم خططًا لإطلاق نموذج جديد يعتمد على OLMo الخاص بهم ويتم تدريبه بواسطة Tülu3، والذي سيكون حلاً مفتوح المصدر تمامًا من البداية إلى النهاية.
لا تُظهر هذه التقنية مفتوحة المصدر فقط تصميم AI2 على تعزيز إضفاء الطابع الديمقراطي على الذكاء الاصطناعي، ولكنها تضخ أيضًا دفعة في مجتمع الذكاء الاصطناعي مفتوح المصدر بأكمله. إنه يقربنا خطوة واحدة من نظام بيئي للذكاء الاصطناعي مفتوح وشفاف حقًا.
لقد ضخ المصدر المفتوح لـ Tülu3 حيوية جديدة في تطوير مجال الذكاء الاصطناعي وبشر بمستقبل أكثر انفتاحًا وشفافية للذكاء الاصطناعي. سيؤدي ذلك إلى تعزيز تعميم وتطبيق تكنولوجيا الذكاء الاصطناعي، وتعزيز عملية إضفاء الطابع الديمقراطي على الذكاء الاصطناعي، والسماح لمزيد من الناس بالاستفادة من تقدم تكنولوجيا الذكاء الاصطناعي.