تعاون فريق Kunlun Wanwei Yan Shuicheng مع جامعة Nanyang التكنولوجية في سنغافورة لإطلاق مشروع مذهل يسمى Q*، والذي يهدف إلى تحسين قدرات التفكير لنماذج اللغات الصغيرة بشكل كبير. على عكس نماذج اللغات الكبيرة الأخرى الموجودة في السوق، يركز Q* على تحسين أداء النماذج الصغيرة، مما يجعل قدراته المنطقية قابلة للمقارنة بالنماذج ذات المعلمات الأكبر بعشرات أو حتى مئات المرات. ومن المتوقع أن تغير نتيجة البحث هذه القيود المفروضة على النماذج الصغيرة في التطبيقات العملية وتجلب فرص تطوير جديدة في مجال الذكاء الاصطناعي. من خلال الخوارزميات المبتكرة، قامت Q* بتحسين القدرات الاستدلالية للنماذج الصغيرة بشكل كبير، وحققت نتائج ممتازة تفوق النماذج الكبيرة في اختبارات قياس الأداء المتعددة.
في الآونة الأخيرة، أصدر فريق Kunlun Wanwei Yan Shuicheng المحلي وفريق البحث من جامعة Nanyang التكنولوجية في سنغافورة مشروعًا يسمى Q*، يهدف إلى تحسين قدرات الاستدلال للنماذج الصغيرة. يختلف هذا المشروع عن OpenAI، لكنه يمكنه تمكين النماذج الصغيرة من تحقيق القدرات المنطقية للنماذج ذات المعلمات الأكبر منه بعشرات أو حتى مئات المرات.
حقق فريق البحث نتائج رائعة من خلال الأداء التجريبي لخوارزمية Q*: في مجموعة بيانات GSM8K، ساعدت Q* Llama-2-7b على تحسين دقة تبلغ 80.8%، متجاوزة ChatGPT.
في مجموعة بيانات MATH، ساعد Q* DeepSeek-Math-7b على التحسن إلى دقة تصل إلى 55.4%، متجاوزًا Gemini Ultra.
في مجموعة بيانات MBPP، ساعد Q * CodeQwen1.5-7b-Chat على زيادة الدقة إلى 77.0%، مما أدى إلى تضييق فجوة مستوى البرمجة مع GPT-4. تظهر هذه النتائج إمكانات خوارزمية Q* في تحسين قدرات الاستدلال للنماذج الصغيرة.
يتمثل مبدأ عمل خوارزمية Q* في تحليل مسار الاستدلال لنموذج اللغة الكبير إلى عدة حالات، وإجراء تخطيط شامل لكل حالة، واستخدام خوارزمية البحث A* لتحقيق أولوية البحث عن مهام الاستدلال المعقدة. وفي الوقت نفسه، قاموا أيضًا بتدريب نموذج قيمة Q للوكيل من خلال التعلم الخاضع للإشراف للحصول على قيمة Q المثالية لزوج الحالة والإجراء، وبالتالي تحسين أداء النموذج.
تسليط الضوء على:
لم يتم إصدار مشروع Q* بواسطة OpenAI من خلال خوارزمية فريق البحث، تم تحسين القدرة المنطقية للنموذج الصغير بشكل كبير.
حقق المشروع نتائج تجريبية رائعة على مجموعات بيانات متعددة، مما يدل على إمكانات وفعالية خوارزمية Q*.
رابط الورقة: https://arxiv.org/abs/2406.14283
توفر نتائج البحث لمشروع Q* اتجاهًا جديدًا لتطوير النماذج الصغيرة، وتستحق الخوارزمية الفعالة وتأثير التحسين الكبير الاهتمام. وفي المستقبل، من المتوقع أن يتم تطبيق هذه الخوارزمية في المزيد من المجالات وتعزيز تقدم تكنولوجيا الذكاء الاصطناعي. تم توفير رابط للورقة للقراء المهتمين لمعرفة المزيد من التفاصيل.