ولد جوجل الجوزاء إكسب 1114! تم سحق GPT-4 في المعركة الأولى، ووصل إلى القمة في تقييمات القدرات المتعددة وأحدث صدمة في الصناعة

الكاتب：Eve Cole وقت التحديث：2025-01-28 08:48:02

تعمل النسخة التجريبية من Google DeepMind Gemini (Exp1114) بشكل مذهل على منصة Chatbot Arena! وبعد اختبار المجتمع بأكثر من 6000 صوت، تفوقت على منافسيها في العديد من المجالات الرئيسية، وخاصة الرياضيات والمطالبات المعقدة والكتابة الإبداعية، مما يدل على قدرات شاملة قوية. سيمنحك محرر Downcodes فهمًا متعمقًا للأداء المتميز لـ Gemini-Exp-1114 وتفسير الصناعة له.

حقق الإصدار التجريبي الأحدث من Google DeepMind Gemini (Exp1114) نتائج مبهرة على منصة Chatbot Arena. وبعد أكثر من أسبوع من اختبار المجتمع، تظهر البيانات المتراكمة لأكثر من 6000 صوت أن هذا النموذج الجديد يتفوق على المنتجات المنافسة بمزايا كبيرة ويظهر قوة مذهلة في العديد من المجالات الرئيسية.

من حيث النتيجة الإجمالية، تعادل Gemini-Exp-1114 في المركز الأول مع GPT-4 الأحدث بنتيجة ممتازة تزيد عن 40 نقطة، متجاوزًا إصدار معاينة GPT-4 الرائد سابقًا. والأكثر إثارة للدهشة هو أن هذا النموذج قد وصل إلى القمة في المجالات الأساسية مثل الرياضيات، والمطالبات المعقدة، والكتابة الإبداعية، مما يظهر قوته الشاملة القوية.

وعلى وجه التحديد، فإن التقدم الذي أحرزه Gemini-Exp-1114 مثير للإعجاب:

قفز من المركز الثالث إلى الأول في التصنيف العام

ارتفع تقييم القدرة في الرياضيات من المركز الثالث إلى الأول

ارتفعت المعالجة السريعة المعقدة من المركز الرابع إلى الأول

تحسن أداء الكتابة الإبداعية من المركز الثاني إلى الأول

قدرات المعالجة المرئية تتصدر القائمة أيضًا

كما تحسن مستوى البرمجة من الخامس إلى الثالث

أطلق Google AI Studio رسميًا هذا الإصدار الجديد ليجربه المستخدمون. ومع ذلك، أعرب المجتمع أيضًا عن قلقه بشأن بعض المشكلات المحددة، مثل ما إذا كان حد الـ 1000 رمز لا يزال موجودًا، وكيفية التعامل مع مشكلات التطبيق العملي مثل إخراج النص الطويل للغاية.

ويعتقد محللو الصناعة أن هذا الاختراق يظهر أن استثمار جوجل طويل المدى في مجال الذكاء الاصطناعي بدأ يؤتي ثماره. ومن المثير للاهتمام أن النموذج يحتفظ بالمرتبة الرابعة في التحكم في الأسلوب، مما قد يعني أن فريق التطوير اعتمد بشكل أساسي أساليب جديدة بعد التدريب بدلاً من إجراء تغييرات على النموذج الذي تم تدريبه مسبقًا.

أثار هذا الاختراق الكبير أيضًا مناقشات حول هيكل الصناعة. غالبًا ما تطلق OpenAI منتجات جديدة عندما يصدر المنافسون تحديثات مهمة، ولكن هذه المرة كان تقدم Google كبيرًا جدًا لدرجة أنه جذب انتباه الصناعة. يعتقد بعض الناس أن هذا قد يبشر بوصول Gemini2، وأن القدرة التنافسية لشركة Google في مجال النماذج الكبيرة آخذة في التحسن بشكل ملحوظ.

يمثل الأداء الممتاز لـ Gemini-Exp-1114 إنجازًا بارزًا آخر لشركة Google في مجال نماذج الذكاء الاصطناعي الكبيرة، كما يوفر أيضًا المزيد من الإمكانيات لتطوير الذكاء الاصطناعي في المستقبل. ونحن نتطلع إلى المزيد من المفاجآت في الإصدارات اللاحقة من الجوزاء!