أصدرت Google مؤخرًا تحديثًا رئيسيًا لنموذج Gemini AI - Gemini 2.0 Flash. يقدم النموذج تحسينات كبيرة في السرعة وقدرات الوسائط المتعددة، مع ضعف سرعة المعالجة من سابقتها ودعم المعالجة في الوقت الفعلي لتدفقات الصوت والفيديو، بالإضافة إلى إنشاء الصور الأصلية. يمثل هذا التحديث معلمًا مهمًا آخر في استكشاف Google المستمر في مجال الذكاء الاصطناعي، مما يوفر أدوات ذكاء اصطناعي أكثر قوة للمستخدمين والمطورين.
أطلق قسم أبحاث الذكاء الاصطناعي التابع لشركة التكنولوجيا العملاقة جوجل مؤخرًا أحدث إصدار من نموذج Gemini AI-Gemini2.0Flash. يقدم هذا النموذج الجديد تحسينات كبيرة في الأداء، خاصة فيما يتعلق بسرعة المعالجة وتوسيع الميزات متعددة الوسائط.
يقول المسؤولون إن مستخدمي Gemini حول العالم يمكنهم الوصول إلى الإصدار المحسّن للدردشة عن طريق تحديد الإصدار التجريبي 2.0 Flash في القائمة المنسدلة للنموذج على سطح المكتب والويب المحمول، وسيكون متاحًا في تطبيق Gemini للهاتف المحمول قريبًا. في أوائل العام المقبل، سيتم توسيع Gemini2.0 ليشمل المزيد من منتجات Google.
التطور الرئيسي في Gemini 2.0 Flash هو سرعة المعالجة المحسنة. وتقول جوجل إن النموذج الجديد يعمل بسرعة مضاعفة مقارنة بالجيل السابق Gemini 1.5 Pro، بينما يُظهر أيضًا أداءً أفضل في الاختبارات المعيارية المختلفة. وتعني هذه الزيادة في السرعة أن المستخدمين سيستمتعون بقوة معالجة أكثر كفاءة وأوقات استجابة أسرع.
بالإضافة إلى ذلك، تم أيضًا توسيع Gemini2.0Flash في معالجة أنواع البيانات المتنوعة. يشتمل النموذج الآن على واجهة برمجة تطبيقات متعددة الوسائط في الوقت الفعلي قادرة على معالجة تدفقات الصوت والفيديو في الوقت الفعلي. يتيح ذلك للمطورين إنشاء تطبيقات تستفيد من المدخلات الصوتية والمرئية الديناميكية. وفي الوقت نفسه، يدمج النموذج أيضًا إمكانات إنشاء الصور الأصلية، مما يسمح للمستخدمين بإنشاء الصور وتعديلها من خلال مطالبات نص المحادثة.
بالإضافة إلى هذه التطورات الأساسية، يتضمن Gemini 2.0 Flash أيضًا العديد من التحسينات الأخرى. يدعم الآن إخراج الصوت الأصلي متعدد اللغات ثمانية أصوات مختلفة، مما يوسع إمكانية الوصول العالمية للنموذج. تعمل التحسينات على دعم الأدوات والوكلاء على تمكين النماذج من التفاعل بشكل أكثر كفاءة مع الأدوات والأنظمة الخارجية لإكمال المهام الأكثر تعقيدًا.
وفيما يتعلق بمهام هندسة البرمجيات، حقق برنامج Gemini2.0 Flash درجة 51.8% على معيار SWE-bench الذي تم التحقق منه، والذي تم تصميمه لتقييم كفاءة البرمجة. توضح هذه النتيجة إمكانات النموذج لمساعدة المطورين في عملية إنشاء التعليمات البرمجية وتصحيح الأخطاء والتحسين.
تقوم Google بدمج Gemini2.0 Flash في أدوات التطوير الخاصة بها. يعمل وكيل التعليمات البرمجية الجديد Jules، الذي يعمل بالذكاء الاصطناعي، على الاستفادة من Gemini 2.0 Flash لمساعدة المطورين في Google Colaboratory. يوضح هذا التكامل التطبيق العملي للنموذج في بيئة التطوير.
يتضمن Gemini2.0 Flash أيضًا ميزات تتعلق بالتطوير المسؤول للذكاء الاصطناعي. يعمل دعم 109 لغة على توسيع إمكانية الوصول العالمية للنموذج. تحتوي جميع مخرجات الصور والصوت التي تم إنشاؤها على علامات مائية SynthID مدمجة، مما يوفر آلية لتتبع المصادر وحل المشكلات المحتملة المتعلقة بالمحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي.
يمثل إصدار Gemini2.0 Flash خطوة أخرى في تطوير نماذج الذكاء الاصطناعي من Google. يساهم التركيز على زيادة السرعة وتوسيع القدرات متعددة الوسائط وتحسين التفاعل بين الأدوات في إنشاء أنظمة ذكاء اصطناعي أكثر تنوعًا وقوة.
ومع استمرار Google في تطوير عائلة نماذج Gemini، من المتوقع إجراء المزيد من التحسينات وتوسيع القدرات. يساهم Gemini2.0Flash في التقدم المستمر لتقنية الذكاء الاصطناعي وتطبيقاتها المحتملة في مختلف المجالات.
المقدمة الرسمية: https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#gemini-2-0-flash
أبرز النقاط:
Gemini2.0 Flash أسرع بمرتين من الجيل السابق، وتم تحسين أدائه بشكل ملحوظ.
️ يضيف النموذج واجهة برمجة تطبيقات متعددة الوسائط في الوقت الفعلي لدعم المعالجة في الوقت الفعلي لتدفقات الصوت والفيديو.
️ وظيفة إنشاء الصور الأصلية المتكاملة، وإنشاء الصور وتعديلها من خلال المطالبات النصية.
يبشر إصدار Gemini 2.0 Flash بإنجاز جديد في السرعة والتطبيق المتعدد الوسائط لتقنية الذكاء الاصطناعي، وهو أمر يستحق التطلع إليه. كما أن ابتكار Google المستمر في مجال الذكاء الاصطناعي يستحق الاهتمام.