لقد أحرز ARC-AGI، وهو معيار مصمم لتقييم القدرات التجريدية والاستدلالية للذكاء الاصطناعي العام (AGI)، تقدمًا مؤخرًا، لكن منشئه فرانسوا شوليه يذكرنا بأن هذا لا يعني أن الذكاء الاصطناعي العام يقترب. وأشار إلى أن أداء أنظمة الذكاء الاصطناعي الحالية في اختبار ARC-AGI لا يزال أقل بكثير من التوقعات، والسبب الرئيسي هو القيود المفروضة على نماذج اللغة الكبيرة (LLM)، التي تعد أفضل في التعرف على الأنماط من التفكير الحقيقي. أطلق شولاي ومعاونوه مسابقة بقيمة مليون دولار لتعزيز اختراقات الذكاء الاصطناعي مفتوحة المصدر على ARC-AGI، لكن النتائج أكدت أيضًا أن الاختبار نفسه قد يكون به عيوب ويحتاج إلى مزيد من التحسين.
منذ إطلاقه في عام 2019، كان ARC-AGI محط اهتمام في مجال الذكاء الاصطناعي. وعلى الرغم من أن نظام الذكاء الاصطناعي أحرز بعض التقدم في الاختبار، إلا أن درجاته كانت لا تزال أقل بكثير من المستويات البشرية. وقد أثار هذا التفكير في الاتجاه الحالي لتطوير الذكاء الاصطناعي ودفع الباحثين إلى إعادة النظر في تعريف وطرق تقييم الذكاء الاصطناعي العام. تحلل المقالة القيود المفروضة على اختبار ARC-AGI بالتفصيل، بالإضافة إلى آفاق اتجاهات أبحاث AGI المستقبلية، وتعرض نتائج المنافسة ذات الصلة واستراتيجيات التكيف الخاصة بالباحثين.
ومع ذلك، لم يتوقف شولاي عن الدفع باتجاه أبحاث الذكاء الاصطناعي. أطلق هو ومؤسس Zapier مايك نوب مسابقة بقيمة مليون دولار في يونيو من هذا العام لتشجيع الذكاء الاصطناعي مفتوح المصدر لتحدي معيار ARC-AGI. على الرغم من أن نظام الذكاء الاصطناعي الأفضل أداءً حصل على 55.5% فقط من أصل 17789 مدخلاً، أي أقل من علامة 85% المطلوبة لتحقيق "الأداء البشري"، إلا أن شولاي ونوب ما زالا يعتبران ذلك خطوة مهمة إلى الأمام.
وأشار نوب في منشور على مدونته إلى أن هذا الإنجاز لا يعني أننا أقرب إلى تحقيق الذكاء الاصطناعي العام، بل يسلط الضوء على أن بعض المهام في ARC-AGI تعتمد بشكل كبير على حلول "القوة الغاشمة" وقد لا تقدم إشارات فعالة للجنرال الحقيقي. ذكاء. تم تصميم ARC-AGI في الأصل لاختبار قدرة تعميم الذكاء الاصطناعي من خلال توفير مهام معقدة لم يسبق لها مثيل، ومع ذلك، لا تزال هناك شكوك حول ما إذا كانت هذه المهام يمكنها تقييم الذكاء الاصطناعي العام بشكل فعال.
ملاحظة لمصدر الصورة: تم إنشاء الصورة بواسطة الذكاء الاصطناعي وموفر خدمة ترخيص الصور Midjourney
تتضمن المهام في معيار ARC-AGI مسائل ألغاز وما إلى ذلك، والتي تتطلب من الذكاء الاصطناعي استنتاج إجابات غير معروفة بناءً على معلومات معروفة. على الرغم من أن هذه المهام يبدو أنها تعزز تكيف الذكاء الاصطناعي مع المواقف الجديدة، إلا أن النتائج تظهر أن النماذج الحالية تبدو وكأنها تجد الحلول من خلال عدد كبير من الحسابات، ولا تظهر بالضرورة القدرة على التكيف الذكي الحقيقي.
بالإضافة إلى ذلك، واجه مبتكرو ARC-AGI انتقادات من أقرانهم، لا سيما فيما يتعلق بالغموض المحيط بتعريف AGI. صرح أحد موظفي OpenAI مؤخرًا أنه إذا تم تعريف الذكاء الاصطناعي العام على أنه ذكاء اصطناعي "يؤدي بشكل أفضل من معظم البشر في معظم المهام"، فهذا يعني أن الذكاء الاصطناعي العام قد تم تحقيقه بالفعل. ومع ذلك، يرى شوليت ونوب أن التصميمات الحالية لمعيار ARC-AGI لم تحقق هذا الهدف بالكامل بعد.
للمضي قدمًا، يخطط Sholay وKnoop لإصدار جيل ثانٍ من معيار ARC-AGI وسيعقدان مسابقة جديدة في عام 2025 لمعالجة أوجه القصور في الاختبارات الحالية. وقالوا إن المعيار الجديد سيركز بشكل أكبر على تعزيز تطوير أبحاث الذكاء الاصطناعي في اتجاه أكثر أهمية وتسريع تنفيذ الذكاء الاصطناعي العام.
ومع ذلك، فإن تحديد المعايير الحالية ليس بالمهمة السهلة. تظهر جهود شولاي وكنوب أن تعريف الذكاء في الذكاء الاصطناعي، وخاصة في مجال الذكاء العام، يظل مهمة صعبة ومعقدة.
بشكل عام، يعكس التقدم المحرز في معيار ARC-AGI والمناقشات ذات الصلة أن استكشاف الذكاء الاصطناعي العام في مجال الذكاء الاصطناعي لا يزال مستمرًا، مع وجود حاجة إلى تعريفات أكثر صرامة وطرق تقييم أكثر فعالية المستقبل. تعزيز التنمية الحقيقية للذكاء الاصطناعي.