في الآونة الأخيرة، اشتدت المنافسة بين عملاقي الذكاء الاصطناعي Google وOpenAI، حيث يتنافس الطرفان بشدة في تطوير وسرعة تكرار نماذج اللغة واسعة النطاق. تجاوز نموذج Gemini-Exp-1121 الذي تم إصداره حديثًا من Google نموذج GPT-4o الخاص بـ OpenAI في العديد من المؤشرات الرئيسية، ليحتل مرة أخرى المركز الأول في منافسة الذكاء الاصطناعي. سيمنحك محرر Downcodes فهمًا متعمقًا لهذه "الهجوم الخاطف" في مجال الذكاء الاصطناعي، بالإضافة إلى أحدث التطورات في التكنولوجيا والوظائف بين الطرفين.
في الآونة الأخيرة، احتدمت المنافسة بين Google وOpenAI مرة أخرى. بعد يوم واحد فقط من تصدر الإصدار الجديد من GPT-4o قائمة منافسات الذكاء الاصطناعي، أطلقت جوجل أحدث طراز تجريبي Gemini-Exp-1121، وسرعان ما استعادت البطولة. قبل أسبوع واحد فقط، أصدرت Google Gemini-Exp-1114، والذي يبدو أنه يشير إلى أن Google استجابت بسرعة كبيرة لديناميكيات OpenAI.
قال جاك راي، كبير العلماء في Google DeepMind، إن هذه كانت "هجومًا خاطفًا"، مما يعني أن سرعة التكرار بعد التدريب أسرع من التدريب المسبق.
وفقًا للمعلومات الرسمية، تم تحسين Gemini-Exp-1121 بشكل كبير في العديد من الجوانب، وهو ما ينعكس بشكل أساسي في تعزيز قدرات الترميز وقدرات التفكير وقدرات الفهم البصري. بالإضافة إلى ذلك، وصل هذا النموذج إلى مستوى مماثل للمعاينة الحالية لـ o1 وNew Sonnet3.5 في التحكم في أسلوب الكلمات السريعة المعقدة.
في الاختبارات الفعلية، كان أداء Gemini-Exp-1121 أفضل أيضًا من الإصدار الجديد من GPT-4o في التعامل مع فهم الرسوم الهزلية، وكانت إجاباته أكثر شمولاً ويمكنه استخدام الترجمات المصاحبة والتأكيد الجريء بوضوح لتقديم المعلومات. في سؤال الاستدلال المنطقي الكلاسيكي لـ Animal Crossing River، كانت إجابة Gemini-Exp-1121 صحيحة تمامًا، مما أظهر قدرة تفكير منطقية أقوى. من ناحية أخرى، ارتكب الإصدار الجديد من GPT-4o بعض الأخطاء.
وفي الوقت نفسه، تعمل OpenAI أيضًا بنشاط على تطوير ميزات جديدة. ومؤخرًا، تم اكتشاف رمز وظيفة الفيديو "Live Camera" في أحدث إصدار من ChatGPT، مما يشير إلى تقدمها في التعرف على الصوت والبصر. وسيختبر مستخدمو OpenAI أيضًا هذه الإمكانية لأول مرة عند استخدام وضع الكلام المتقدم، مما يوضح عزمها على توسيع استخدام هذه الميزة في المستقبل.
من المتوقع أن تتحول الطريقة الرئيسية للاتصال مع Chatbot في العام المقبل تدريجيًا من الحوار النصي التقليدي إلى خدمات الوكيل الصوتية والأكثر ذكاءً، وقد يكون هذا التغيير ناتجًا عن إطلاق وظيفة "الكاميرا الحية".
لا تزال منافسة الذكاء الاصطناعي هذه مستمرة، حيث يتنافس كل من Google وOpenAI مع بعضهما البعض، مما يشير إلى أن تقنية الذكاء الاصطناعي ستستمر في تحقيق اختراقات وابتكارات في المستقبل، مما يوفر خدمات أكثر ملاءمة وأكثر ذكاءً للمستخدمين. دعونا ننتظر ونرى من سيفوز في النهاية!