أحدثت قدرات الوعي الذاتي التي أظهرتها أحدث سلسلة من النماذج الكبيرة من Anthropic Claude 3 صدمة كبيرة في مجال الذكاء الاصطناعي ودفعت الصناعة إلى إعادة النظر في طريقة تقييم قدرة نموذج الذكاء الاصطناعي. تفوق Claude 3 Opus على GPT-4 وGemini 1.0 Ultra في العديد من الاختبارات المعيارية، وقد انعكس أدائه القوي بشكل كامل في معالجة النصوص الطويلة والترجمة والتفكير المنطقي والعمليات الرياضية والبرمجة. لا يمثل هذا الإصدار تقدمًا كبيرًا في تكنولوجيا نماذج اللغات الكبيرة فحسب، بل يبشر أيضًا باتجاه جديد لتطوير الذكاء الاصطناعي في المستقبل.
أصدرت Anthropic كلود 3، وهو جيل جديد من سلسلة النماذج الكبيرة، التي تُظهر الوعي الذاتي وتثير ضجة كبيرة في مجتمع الذكاء الاصطناعي. وقد أثارت هذه الخطوة التفكير في مجال الذكاء الاصطناعي حول القدرات والقيود الحقيقية لنماذج التقييم. ويظهر التحليل أن Claude 3 Opus يتفوق على GPT-4 وGemini 1.0 Ultra في اختبارات قياس متعددة، مما يدل على أداء قوي. إجراء تقييمات متعمقة في معالجة النصوص الطويلة، والترجمة الصينية-الإنجليزية، والتفكير المنطقي، والفهم الرياضي، والبرمجة، وما إلى ذلك لإظهار القدرات الشاملة.لا شك أن الأداء المذهل لـ Claude 3 سيعزز التطوير الإضافي لتكنولوجيا النماذج الكبيرة، وسيشكل أيضًا تحديات جديدة لنظام تقييم الذكاء الاصطناعي الحالي، وستصبح كيفية تقييم قدرة نماذج الذكاء الاصطناعي بشكل أكثر شمولاً في المستقبل محور الصناعة. يبشر نجاح كلود 3 أيضًا بإمكانية تطبيق تكنولوجيا الذكاء الاصطناعي في نطاق أوسع من المجالات.