يُظهر نموذج الاستدلال Marco-o1 الذي أصدره مؤخرًا فريق Alibaba International AI Team إمكانات كبيرة في حل المشكلات المفتوحة. فهو يكسر قيود النماذج التقليدية التي تقتصر على مجالات الإجابة القياسية، ويلتزم باستكشاف التطبيقات في المجالات التي يصعب تحديدها كميًا وتفتقر إلى مكافآت واضحة. تكمن السمة الأساسية لهذا النموذج في أسلوبه التدريبي الفريد واستراتيجية توسيع مساحة الحل، والتي تمكنه من التعامل مع المهام الأكثر تعقيدًا والأطول صعوبة، مثل ترجمة الجمل الطويلة والصعبة، ويظهر قدرة قوية على التفكير المنطقي لتفكيك المشكلات تدريجيًا، وأخيرًا إعطاء إجابات دقيقة. يوفر المصدر المفتوح لـ Marco-o1 أيضًا موارد قيمة لمجتمع أبحاث الذكاء الاصطناعي.
أصدر فريق علي بابا الدولي للذكاء الاصطناعي مؤخرًا نموذجًا جديدًا للاستدلال يسمى Marco-o1، والذي يولي اهتمامًا خاصًا لحل المشكلات المفتوحة ولا يقتصر على مجالات المواضيع ذات الإجابات القياسية، مثل البرمجة والرياضيات. يلتزم فريق البحث باستكشاف ما إذا كان من الممكن تعميم هذه النماذج بشكل فعال على المجالات التي يصعب قياسها وتفتقر إلى مكافآت واضحة.
تتضمن خصائص نموذج Marco-o1 استخدام بيانات CoT الطويلة جدًا للضبط الدقيق، واستخدام MCTS لتوسيع مساحة الحل، وتوسيع مساحة الحل الدقيقة. يستخدم النموذج التشغيل الذاتي + MCTS لإنشاء مجموعة من بيانات CoT الطويلة للغاية مع القدرة على الانعكاس والتصحيح، ويتم تدريبه مع بيانات أخرى مفتوحة المصدر. بالإضافة إلى ذلك، حدد فريق البحث أيضًا خطوة صغيرة لتوسيع مساحة الحل للنموذج وتوجيه النموذج لإخراج إجابات أفضل.
وفي مهمة الترجمة، أظهر نموذج Marco-o1 قدرته على التعامل مع ترجمة الجمل الطويلة والصعبة. وهذه هي المرة الأولى التي يتم فيها تطبيق تمديد وقت الاستدلال على مهام الترجمة الآلية. قام فريق البحث بفتح مصادر بعض بيانات CoT وأفضل النماذج الحالية، ويخطط لفتح المزيد من البيانات والنماذج في المستقبل.
سوف يفكر النموذج بعمق في الاستجابة عند التفكير، على سبيل المثال، عند إخراج عدد حرف "r" في كلمة "فراولة"، سيقوم النموذج بتفكيك كل حرف في الكلمة تدريجيًا ومقارنته، وأخيرًا إخراج النتيجة بشكل صحيح. وفي مجال الترجمة الآلية، يقوم النموذج بتحديد النقاط الصعبة بشكل صحيح من خلال روابط الاستدلال وترجمتها كلمة بكلمة، مما يحسن دقة الترجمة الإجمالية.
وقد جربه فريق البحث أيضًا في مجالات أخرى، مما أثبت قدرة النموذج على حل المشكلات العامة الأخرى في العالم الحقيقي. يستخدم الهيكل العام لـ Marco-o1 التشغيل الذاتي + MCTS لإنشاء مجموعة من بيانات CoT الطويلة جدًا مع القدرة على عكسها وتصحيحها وتدريبها مع بيانات أخرى مفتوحة المصدر. قام فريق البحث أيضًا بدمج بعض مجموعات بيانات الامتثال للتعليمات من عائلة MarcoPolo لتحسين قدرات الامتثال للتعليمات الخاصة بالنموذج.
فيما يتعلق بالاستخدام، يوفر فريق البحث رمزًا استدلاليًا ورمزًا دقيقًا، ويمكن للمستخدمين بسهولة تحميل النموذج والرمز المميز وبدء الدردشة أو ضبط النموذج. بالإضافة إلى ذلك، يمكن أيضًا تشغيل النموذج مباشرةً على إصدار GGUF على ModelScope، مما يوفر طريقة أسرع لتجربته.
يمثل إصدار نموذج Marco-o1 خطوة مهمة اتخذها فريق الذكاء الاصطناعي الدولي التابع لشركة علي بابا في مجال نماذج الاستدلال، حيث يقدم أفكارًا وأدوات جديدة لحل المشكلات المفتوحة.
نطاق النموذج:
https://modelscope.cn/models/AIDC-AI/Marco-o1
أركايف:
https://arxiv.org/abs/2411.14405
جيثب:
https://github.com/AIDC-AI/Marco-o1
احتضان الوجه:
https://huggingface.co/AIDC-AI/Marco-o1
بشكل عام، يوفر المصدر المفتوح لنموذج Marco-o1 إمكانيات جديدة لأبحاث وتطبيقات الذكاء الاصطناعي، كما أن اختراقاته في حل المشكلات المفتوحة تستحق التطلع إليها. تسهل الروابط ذات الصلة على المستخدمين فهم النموذج واستخدامه بشكل أكبر.