في الآونة الأخيرة، انخرطت شركتا Google وOpenAI، العملاقتان في مجال الذكاء الاصطناعي، في منافسة شرسة، وكانت سرعة النماذج الجديدة التي أطلقها كلا الطرفين مذهلة. ولا تنعكس هذه المنافسة في المنافسة على أداء النماذج فحسب، بل تعكس أيضًا التطور السريع لتكرارات تكنولوجيا الذكاء الاصطناعي والقدرة على الاستجابة السريعة للسوق. سيستمر استثمار Google وOpenAI والابتكار في البحث والتطوير التكنولوجي في تعزيز التقدم في مجال الذكاء الاصطناعي وتقديم خدمات أكثر ملاءمة وأكثر ذكاءً للمستخدمين.
في الآونة الأخيرة، احتدمت المنافسة بين Google وOpenAI مرة أخرى. بعد يوم واحد فقط من تصدر الإصدار الجديد من GPT-4o قائمة منافسات الذكاء الاصطناعي، أطلقت جوجل أحدث طراز تجريبي Gemini-Exp-1121، وسرعان ما استعادت البطولة. قبل أسبوع واحد فقط، أصدرت Google Gemini-Exp-1114، والذي يبدو أنه يشير إلى أن Google استجابت بسرعة كبيرة لديناميكيات OpenAI.
قال جاك راي، كبير العلماء في Google DeepMind، إن هذه كانت "هجومًا خاطفًا"، مما يعني أن سرعة التكرار بعد التدريب أسرع من التدريب المسبق.
وفقًا للمعلومات الرسمية، تم تحسين Gemini-Exp-1121 بشكل كبير في العديد من الجوانب، وهو ما ينعكس بشكل أساسي في تعزيز قدرات الترميز وقدرات التفكير وقدرات الفهم البصري. بالإضافة إلى ذلك، وصل هذا النموذج إلى مستوى مماثل للمعاينة الحالية لـ o1 وNew Sonnet3.5 في التحكم في أسلوب الكلمات السريعة المعقدة.
في الاختبارات الفعلية، كان أداء Gemini-Exp-1121 أفضل أيضًا من الإصدار الجديد من GPT-4o في التعامل مع فهم الرسوم الهزلية، وكانت إجاباته أكثر شمولاً ويمكنه استخدام الترجمات المصاحبة والتأكيد الجريء بوضوح لتقديم المعلومات. في سؤال الاستدلال المنطقي الكلاسيكي لـ Animal Crossing River، كانت إجابة Gemini-Exp-1121 صحيحة تمامًا، مما أظهر قدرة تفكير منطقية أقوى. من ناحية أخرى، ارتكب الإصدار الجديد من GPT-4o بعض الأخطاء.
وفي الوقت نفسه، تعمل OpenAI أيضًا بنشاط على تطوير ميزات جديدة. ومؤخرًا، تم اكتشاف رمز وظيفة الفيديو "Live Camera" في أحدث إصدار من ChatGPT، مما يشير إلى تقدمها في التعرف على الصوت والبصر. وسيختبر مستخدمو OpenAI أيضًا هذه الإمكانية لأول مرة عند استخدام وضع الكلام المتقدم، مما يوضح عزمها على توسيع استخدام هذه الميزة في المستقبل.
من المتوقع أن تتحول الطريقة الرئيسية للاتصال مع Chatbot في العام المقبل تدريجيًا من الحوار النصي التقليدي إلى خدمات الوكيل الصوتية والأكثر ذكاءً، وقد يكون هذا التغيير ناتجًا عن إطلاق وظيفة "الكاميرا الحية".
تسليط الضوء على:
وسرعان ما تفوق نموذج Google الجديد Gemini-Exp-1121 على GPT-4o بعد وصوله إلى القمة وعاد إلى صدارة منافسة الذكاء الاصطناعي.
قام Gemini-Exp-1121 بتحسين قدراته في الترميز والاستدلال والفهم البصري وأدى أداءً جيدًا.
تعمل شركة OpenAI على تطوير وظيفة "الكاميرا في الوقت الفعلي"، والتي قد تغير طريقة التواصل مع الذكاء الاصطناعي في المستقبل.
وبشكل عام، عززت المنافسة بين Google وOpenAI التطور السريع لتكنولوجيا الذكاء الاصطناعي. وفي المستقبل، ستكون الطريقة التي يتفاعل بها الذكاء الاصطناعي مع البشر أكثر تنوعًا وذكاءً، وهو أمر يستحق التطلع إليه.