أصدرت شركة جوجل أحدث جيل من نموذج الذكاء الاصطناعي Gemini 2.0، مما يمثل إنجازًا كبيرًا لشركة Google في مجال مساعدي الذكاء الاصطناعي العام. يقدم Gemini 2.0 تحسينات كبيرة في المعالجة متعددة الوسائط واستخدام الأدوات، مما يتيح فهمًا أعمق للعالم وتنفيذ أوامر المستخدم. تم تطوير هذا النموذج استنادًا إلى الإصدارين 1.0 و1.5 من Gemini وتم تطبيقه في العديد من منتجات Google، وهو يخدم ملايين المستخدمين حول العالم. ستقدم هذه المقالة بالتفصيل وظائف Gemini 2.0 وتأثيرها على منتجات Google والنظام البيئي للمطورين.
أعلن ساندر بيتشاي، الرئيس التنفيذي لشركة جوجل وشركتها الأم ألفابيت، أن الشركة أطلقت أحدث طراز لها في مجال الذكاء الاصطناعي، Gemini 2.0، والذي يمثل خطوة مهمة لشركة جوجل في بناء مساعد عالمي للذكاء الاصطناعي. يُظهر Gemini 2.0 تطورات كبيرة في معالجة المدخلات متعددة الوسائط واستخدام الأدوات الأصلية، مما يمكّن وكلاء الذكاء الاصطناعي من الحصول على فهم أعمق للعالم من حولهم واتخاذ الإجراءات نيابة عن المستخدم تحت إشرافهم.
تم تطوير Gemini2.0 استنادًا إلى الإصدارات السابقة Gemini1.0 و1.5، والتي حققت لأول مرة قدرات معالجة أصلية متعددة الوسائط ويمكنها فهم مجموعة متنوعة من أنواع المعلومات بما في ذلك النصوص والفيديو والصور والصوت والتعليمات البرمجية. حاليًا، يستخدم الملايين من المطورين برنامج Gemini للتطوير، مما يدفع Google إلى إعادة تصور منتجاتها، بما في ذلك 7 منتجات تخدم 2 مليار مستخدم، وإنشاء منتجات جديدة. يعد NotebookLM مثالاً على القدرات متعددة الوسائط والسياق الطويل وهو محبوب على نطاق واسع.
يبشر إطلاق Gemini 2.0 بدخول Google إلى عصر الوكيل الجديد. يتمتع هذا النموذج بقدرات أصلية لإخراج الصور والصوت، بالإضافة إلى إمكانيات استخدام الأدوات الأصلية. بدأت Google في إتاحة إصدار Gemini 2.0 للمطورين والمختبرين الموثوقين، وتخطط لدمجه سريعًا في المنتجات، بدءًا من Gemini والبحث. من الآن فصاعدًا، سيكون نموذج Gemini2.0 Flash التجريبي مفتوحًا لجميع مستخدمي Gemini. وفي الوقت نفسه، أطلقت جوجل أيضًا ميزة جديدة تسمى Deep Research، والتي تستخدم الاستدلال المتقدم وقدرات السياق الطويل للعمل كمساعد بحث لاستكشاف الموضوعات المعقدة وتجميع التقارير نيابة عن المستخدمين. هذه الميزة متاحة حاليًا في Gemini Advanced.
يعد البحث أحد المنتجات الأكثر تأثراً بالذكاء الاصطناعي، وتصل النظرة العامة للذكاء الاصطناعي من Google الآن إلى مليار شخص، مما يمكنهم من طرح أسئلة جديدة تمامًا، وسرعان ما أصبحت إحدى ميزات البحث الأكثر شيوعًا في Google. كخطوة تالية، ستجلب Google إمكانات الاستدلال المتقدمة لـ Gemini 2.0 إلى AI Overview لحل الموضوعات الأكثر تعقيدًا والمسائل متعددة الخطوات، بما في ذلك المعادلات الرياضية المتقدمة والاستعلام متعدد الوسائط والتشفير. بدأت الاختبارات المحدودة هذا الأسبوع، ومن المقرر طرحها على نطاق أوسع في أوائل العام المقبل. ستواصل Google أيضًا تقديم نظرة عامة على الذكاء الاصطناعي إلى المزيد من البلدان واللغات خلال العام المقبل.
وأظهرت Google أيضًا نتائجها المتطورة في أبحاث الوكلاء من خلال إمكانات Gemini 2.0 الأصلية متعددة الوسائط. يعمل Gemini 2.0 Flash على تحسين 1.5 Flash، وهو النموذج الأكثر شيوعًا بين المطورين حتى الآن، مع أوقات استجابة سريعة مماثلة. ومن الجدير بالذكر أن فلاش 2.0 تفوق على 1.5 Pro في المعايير الرئيسية من خلال سرعته مرتين. يوفر Flash 2.0 أيضًا إمكانات جديدة. بالإضافة إلى دعم الإدخال متعدد الوسائط مثل الصور والفيديو والصوت، يدعم Flash 2.0 الآن الإخراج متعدد الوسائط مثل الصور التي تم إنشاؤها محليًا والمختلطة مع النص وصوت تحويل النص إلى كلام متعدد اللغات (TTS) الذي يمكن التحكم فيه. ويمكنه أيضًا استدعاء أدوات مثل بحث Google وتنفيذ التعليمات البرمجية والوظائف المحددة من قبل المستخدم التابع لجهات خارجية.
يتوفر Gemini 2.0 Flash الآن للمطورين كنموذج تجريبي، مع إتاحة الإدخال متعدد الوسائط وإخراج النص لجميع المطورين عبر Google AI Studio وVertex AI's Gemini API، بينما تتوفر ميزة تحويل النص إلى كلام وتوليد الصور الأصلية لشركاء الوصول المبكر. وسيتبع ذلك التوفر العام في شهر يناير، إلى جانب أحجام النماذج الإضافية.
ولمساعدة المطورين على بناء تطبيقات ديناميكية وتفاعلية، أصدرت Google أيضًا واجهة برمجة تطبيقات جديدة متعددة الوسائط في الوقت الفعلي مع إمكانات إدخال دفق الصوت والفيديو في الوقت الفعلي والقدرة على استخدام أدوات مجمعة متعددة.
بدءًا من اليوم، يمكن لمستخدمي Gemini حول العالم الوصول إلى إصدار محسّن للدردشة من تجربة Flash 2.0 عن طريق تحديده في القائمة المنسدلة للنموذج على سطح المكتب والويب على الأجهزة المحمولة، وسيكون متاحًا قريبًا في تطبيق Gemini للهاتف المحمول. في أوائل العام المقبل، ستقوم Google بتوسيع Gemini 2.0 ليشمل المزيد من منتجات Google.
بشكل عام، يمثل إصدار Gemini 2.0 خطوة أخرى اتخذتها Google في مجال الذكاء الاصطناعي، وستوفر إمكاناتها القوية متعددة الوسائط وتكامل الأدوات تجربة أكثر ثراءً للمطورين والمستخدمين، وستعزز تطبيق تقنية الذكاء الاصطناعي في المزيد من المجالات. التطوير والتطبيق . في المستقبل، سيتم دمج Gemini 2.0 بشكل أكبر في النظام البيئي لمنتجات Google لتقديم خدمات أكثر ذكاءً وملاءمة للمستخدمين.