تم تقليص xAI Grok-2 إلى المركز الثاني في تصنيفات روبوتات الدردشة، وهو يطارد GPT-4o عن كثب

الكاتب：Eve Cole وقت التحديث：2024-12-23 10:48:02

حققت أحدث نماذج اللغات واسعة النطاق لفريق xAI، Grok-2 وGrok-Mini، نتائج مبهرة في تصنيفات LMSys chatbot Arena. وبفضل أدائه القوي، وخاصة أدائه المتميز في المهام الرياضية، احتل Grok-2 المرتبة الثانية، متعادلًا مع نموذج Gemini من Google، بل وتجاوز OpenAI GPT-4o في شهر مايو، وقد حصل هذا الإنجاز على موافقة أكثر من 6000 شخص. كان أداء Grok-Mini جيدًا أيضًا ، حيث احتل المركز الخامس. يوضح هذا التحسن الكبير في التصنيف القوة القوية لفريق xAI في مجال البحث والتطوير لنماذج الذكاء الاصطناعي، كما يوفر اتجاهات وإمكانيات جديدة للتطوير المستقبلي لنماذج اللغات واسعة النطاق.

تشير البيانات إلى أن نموذجي فريق xAI، Grok-2 وGrok-Mini، قد دخلا رسميًا في تصنيفات LMSys Chatbot Arena، ومن بينها، يبرز Grok-2 في المركز الثاني، متجاوزًا GPT-4o من OpenAI (5 أشهر). جنبًا إلى جنب مع أحدث طراز من طراز Gemini، بدعم من الأصوات النشطة من أكثر من 6000 مستخدم من المجتمع.

ومن الجدير بالذكر أن أداء Grok-2 كان جيدًا بشكل خاص في مهام الرياضيات، حيث فاز بالمركز الأول في هذه الفئة، كما حقق نتائج ممتازة في المركز الثاني في العديد من المهام الأخرى، بما في ذلك المطالبات المعقدة والبرمجة واتباع التعليمات. وبالمقارنة، دخلت Grok-2-Mini التصنيف في المركز الخامس، مما يدل على قوتها الكبيرة.

شهدت Grok-2-Mini أيضًا تحسينات كبيرة في السرعة، حيث تعمل الآن أسرع بمرتين من ذي قبل. تأتي قفزة التحسين هذه من فريق الاستدلال التابع لـ xAI، والذي أعاد كتابة مجموعة الاستدلالات بالكامل واستخدم SGLang لتحقيق استدلال متعدد المضيفين أكثر كفاءة ودقة محسنة. وفي الوقت نفسه، قدم الفريق أيضًا خوارزميات أساسية جديدة للحوسبة والاتصالات، بالإضافة إلى جدولة معالجة الدفعات وتكنولوجيا القياس الكمي بشكل أفضل، لزيادة تحسين الأداء العام للنموذج.

على الرغم من أن بعض الأشخاص يشككون في أداء Grok-2 ويعتقدون أن GPT-4o من OpenAI أفضل، إلا أنه في الاستخدام الفعلي، ذكر العديد من المستخدمين أن أداء Grok-2 جيد جدًا في مهام البرمجة والرياضيات. تم إصدار نماذج سلسلة Grok-2 في إصدار تجريبي هذا الشهر، ويمكن للمستخدمين أيضًا تجربتها من خلال منصة X بالإضافة إلى ذلك، يدعم النموذج أيضًا إنشاء الصور باستخدام نموذج إنشاء الصور FLUX.1.

تسليط الضوء على:

✨ احتل Grok-2 المركز الثاني في تصنيفات chatbot LMSys، متجاوزًا GPT-4o (مايو) وتعادلًا في المركز الثاني مع Gemini.

كان أداء Grok-2 جيدًا في مهمة الرياضيات، حيث فاز بالمركز الأول، كما تم تصنيفه من بين الأفضل في العديد من المهام الأخرى.

أصبح Grok-2-Mini أسرع مرتين مما كان عليه من قبل، مما يعزز الأداء بشكل أكبر.

لا يثبت الأداء المتميز لـ Grok-2 وGrok-Mini القدرة الابتكارية لفريق xAI في مجال تكنولوجيا الذكاء الاصطناعي فحسب، بل يوفر أيضًا مرجعًا جديدًا لتطوير نماذج لغوية واسعة النطاق في المستقبل. إن مزاياها في مجالات محددة، مثل الرياضيات والبرمجة، تبشر بالإمكانات الكبيرة لنماذج اللغات الكبيرة للتطبيقات المهنية. أعتقد أن فريق xAI سيجلب المزيد من المفاجآت في المستقبل.