في الآونة الأخيرة، أصدرت شركة Google، العملاقة في مجال الذكاء الاصطناعي، أحدث نموذج لغوي واسع النطاق Gemini 1.5، والذي يحتوي على نافذة سياق مثيرة للإعجاب تضم مليون رمز مميز ويمكنه التعامل مع محتوى يعادل طول كتاب كامل أو حتى فيلم. لا شك أن هذا التطور المذهل قد اجتذب اهتمامًا واسع النطاق في الصناعة، مما يشير إلى أن قدرة النماذج اللغوية واسعة النطاق على معالجة المعلومات قد وصلت إلى مستوى جديد. ومع ذلك، فإن القدرة العالية لا تعني الدقة العالية، وقد أثار أداء Gemini 1.5 في الاختبارات الفعلية النقاش.
أصدرت Google مؤخرًا Gemini 1.5، وهو نموذج يحتوي على نافذة سياقية تضم مليون رمز يمكنه التعامل مع الكتب الكاملة وحتى الأفلام. لكن في الاختبار، لم تكن دقة جيميني 1.5 عالية، خاصة في اختبار "إبرة في كومة قش"، حيث كان متوسط دقته يتراوح بين 60% إلى 70% فقط. بالإضافة إلى ذلك، شككت جوجل أيضًا في صحة الفيديو الذي تم إنتاجه بواسطة OpenAI Sora، ووصفته بأنه مزيف.
يسلط إصدار Gemini 1.5 وشكوك Google حول صحة مقاطع فيديو Sora الضوء على التحديات التي تواجه تطوير نماذج لغوية واسعة النطاق، وتحديدًا كيفية تحسين دقتها وموثوقيتها مع ضمان سعة النموذج. هذه ليست مشكلة تواجهها Google فحسب، ولكنها أيضًا اتجاه تحتاج إليه صناعة الذكاء الاصطناعي بأكملها للعمل معًا. وفي التطوير المستقبلي، يجب إيلاء المزيد من الاهتمام لموثوقية النماذج وسلامتها لضمان أن تكنولوجيا الذكاء الاصطناعي يمكن أن تفيد البشرية حقًا.