يركز نموذج الاستدلال Marco-o1 الذي أصدره فريق Alibaba International AI Team مؤخرًا على حل المشكلات ذات النهايات المفتوحة، واختراق قيود النماذج التقليدية التي تقتصر على حقول الإجابات القياسية، وإظهار إمكاناته في التعامل مع المهام المعقدة والتي يصعب قياسها كميًا. . سيمنحك محرر Downcodes فهمًا متعمقًا لخصائص هذا النموذج وتطبيقاته واستخداماته، بالإضافة إلى الابتكار الذي يجلبه إلى مجال الذكاء الاصطناعي.
أصدر فريق علي بابا الدولي للذكاء الاصطناعي مؤخرًا نموذجًا جديدًا للاستدلال يسمى Marco-o1، والذي يولي اهتمامًا خاصًا لحل المشكلات المفتوحة ولا يقتصر على مجالات المواضيع ذات الإجابات القياسية، مثل البرمجة والرياضيات. يلتزم فريق البحث باستكشاف ما إذا كان من الممكن تعميم هذه النماذج بشكل فعال على المجالات التي يصعب قياسها وتفتقر إلى مكافآت واضحة.
تتضمن خصائص نموذج Marco-o1 استخدام بيانات CoT الطويلة جدًا للضبط الدقيق، واستخدام MCTS لتوسيع مساحة الحل، وتوسيع مساحة الحل الدقيقة. يستخدم النموذج التشغيل الذاتي + MCTS لإنشاء مجموعة من بيانات CoT الطويلة للغاية مع القدرة على الانعكاس والتصحيح، ويتم تدريبه مع بيانات أخرى مفتوحة المصدر. بالإضافة إلى ذلك، حدد فريق البحث أيضًا خطوة صغيرة لتوسيع مساحة الحل للنموذج وتوجيه النموذج لإخراج إجابات أفضل.
وفي مهمة الترجمة، أظهر نموذج Marco-o1 قدرته على التعامل مع ترجمة الجمل الطويلة والصعبة. وهذه هي المرة الأولى التي يتم فيها تطبيق تمديد وقت الاستدلال على مهام الترجمة الآلية. قام فريق البحث بفتح مصادر بعض بيانات CoT وأفضل النماذج الحالية، ويخطط لفتح المزيد من البيانات والنماذج في المستقبل.
سوف يفكر النموذج بعمق في الاستجابة عند التفكير، على سبيل المثال، عند إخراج عدد حرف "r" في كلمة "فراولة"، سيقوم النموذج بتفكيك كل حرف في الكلمة تدريجيًا ومقارنته، وأخيرًا إخراج النتيجة بشكل صحيح. وفي مجال الترجمة الآلية، يقوم النموذج بتحديد النقاط الصعبة بشكل صحيح من خلال روابط الاستدلال وترجمتها كلمة بكلمة، مما يحسن دقة الترجمة الإجمالية.
وقد جربه فريق البحث أيضًا في مجالات أخرى، مما أثبت قدرة النموذج على حل المشكلات العامة الأخرى في العالم الحقيقي. يستخدم الهيكل العام لـ Marco-o1 التشغيل الذاتي + MCTS لإنشاء مجموعة من بيانات CoT الطويلة للغاية مع القدرة على عكسها وتصحيحها وتدريبها مع بيانات أخرى مفتوحة المصدر. قام فريق البحث أيضًا بدمج بعض مجموعات بيانات الامتثال للتعليمات من عائلة MarcoPolo لتحسين قدرات الامتثال للتعليمات الخاصة بالنموذج.
فيما يتعلق بالاستخدام، يوفر فريق البحث رمزًا استدلاليًا ورمزًا دقيقًا، ويمكن للمستخدمين بسهولة تحميل النموذج والرمز المميز وبدء الدردشة أو ضبط النموذج. بالإضافة إلى ذلك، يمكن أيضًا تشغيل النموذج مباشرةً على إصدار GGUF على ModelScope، مما يوفر طريقة أسرع لتجربته.
يمثل إصدار نموذج Marco-o1 خطوة مهمة اتخذها فريق الذكاء الاصطناعي الدولي التابع لشركة علي بابا في مجال نماذج الاستدلال، حيث يقدم أفكارًا وأدوات جديدة لحل المشكلات المفتوحة.
نطاق النموذج:
https://modelscope.cn/models/AIDC-AI/Marco-o1
أركايف:
https://arxiv.org/abs/2411.14405
جيثب:
https://github.com/AIDC-AI/Marco-o1
احتضان الوجه:
https://huggingface.co/AIDC-AI/Marco-o1
يوفر المصدر المفتوح لنموذج Marco-o1 موارد قيمة للباحثين والمطورين، ويُعتقد أن المزيد من التطبيقات المبتكرة المستندة إلى هذا النموذج ستظهر في المستقبل، مما يعزز التطوير المستمر لتكنولوجيا الذكاء الاصطناعي. نتطلع إلى المزيد من حالات التطبيق ونتائج الأبحاث حول Marco-o1!