يحتوي هذا المستودع على بيانات مهمة ARC-AGI، بالإضافة إلى واجهة قائمة على المستعرض ليتمكن البشر من تجربة حل المهام يدويًا.
"يمكن اعتبار ARC معيارًا عامًا للذكاء الاصطناعي، أو كمعيار لتوليف البرامج، أو كاختبار ذكاء نفسي. وهو يستهدف كل من البشر وأنظمة الذكاء الاصطناعي التي تهدف إلى محاكاة شكل يشبه الإنسان من الذكاء السائل العام."
يمكن العثور على وصف كامل لمجموعة البيانات وأهدافها والمنطق الأساسي لها في: حول مقياس الذكاء.
للتذكير، يُقال إن المتقدم للاختبار قد حل مهمة عندما يتمكن، عند رؤية المهمة لأول مرة، من إنتاج شبكة الإخراج الصحيحة لجميع مدخلات الاختبار في المهمة (وهذا يتضمن اختيار أبعاد المخرجات شبكة). لكل إدخال اختبار، يُسمح للمتقدم بإجراء 3 تجارب (وهذا ينطبق على جميع المتقدمين للاختبار، سواء من البشر أو الذكاء الاصطناعي).
يحتوي دليل data
على دليلين فرعيين:
data/training
: يحتوي على ملفات المهام للتدريب (400 مهمة). استخدمها لتكوين نموذج أولي للخوارزمية الخاصة بك أو لتدريب الخوارزمية الخاصة بك لاكتساب مناهج معرفية ذات صلة بـ ARC.data/evaluation
: يحتوي على ملفات المهام للتقييم (400 مهمة). استخدمها لتقييم الخوارزمية النهائية. لضمان الحصول على نتائج تقييم عادلة، لا تقم بتسريب معلومات من مجموعة التقييم إلى الخوارزمية الخاصة بك (على سبيل المثال، من خلال النظر إلى مهام التقييم بنفسك أثناء التطوير، أو عن طريق تعديل الخوارزمية بشكل متكرر أثناء استخدام درجة التقييم الخاصة بها كملاحظات).يتم تخزين المهام بتنسيق JSON. يحتوي كل ملف JSON للمهمة على قاموس يحتوي على حقلين:
"train"
: عرض توضيحي لأزواج الإدخال/الإخراج. إنها قائمة "أزواج" (عادة 3 أزواج)."test"
: اختبار أزواج الإدخال/الإخراج. إنها قائمة "الأزواج" (زوج واحد عادةً)."الزوج" هو قاموس يحتوي على حقلين:
"input"
: "شبكة" الإدخال للزوج."output"
: إخراج "الشبكة" للزوج."الشبكة" هي مصفوفة مستطيلة (قائمة قوائم) من الأعداد الصحيحة بين 0 و9 (شاملة). أصغر حجم ممكن للشبكة هو 1x1 وأكبرها هو 30x30.
عند النظر إلى مهمة ما، يستطيع المتقدم للاختبار الوصول إلى مدخلات ومخرجات أزواج العرض التوضيحي، بالإضافة إلى مدخلات زوج (أزواج) الاختبار. الهدف هو إنشاء شبكة (شبكات) الإخراج المقابلة لشبكة (شبكات) إدخال الاختبار، باستخدام 3 تجارب لكل إدخال اختبار. "إنشاء شبكة الإخراج" يتضمن اختيار ارتفاع وعرض شبكة الإخراج، ثم ملء كل خلية في الشبكة برمز (عدد صحيح بين 0 و9، والذي يتم تصوره على هيئة ألوان). يمكن القول بأن الحلول الدقيقة فقط (جميع الخلايا تتطابق مع الإجابة المتوقعة) صحيحة.
توجد واجهة الاختبار في apps/testing_interface.html
. افتحه في متصفح الويب (يوصى باستخدام Chrome). سيطالبك بتحديد ملف JSON للمهمة.
بعد تحميل المهمة، ستدخل إلى مساحة الاختبار، والتي تبدو كما يلي:
على اليسار، سترى أزواج الإدخال/الإخراج التي توضح طبيعة المهمة. في المنتصف، سترى شبكة إدخال الاختبار الحالية. على اليمين، سترى عناصر التحكم التي يمكنك استخدامها لإنشاء شبكة الإخراج المقابلة.
لديك حق الوصول إلى الأدوات التالية:
عندما تكون شبكة الإخراج الخاصة بك جاهزة، انقر فوق "إرسال" باللون الأخضر. زر للتحقق من إجابتك. نحن لا نطبق قاعدة المحاكمات الثلاث.
بعد حصولك على الإجابة الصحيحة لشبكة إدخال الاختبار الحالية، يمكنك التبديل إلى شبكة إدخال الاختبار التالية للمهمة باستخدام زر "إدخال الاختبار التالي" (إذا كان هناك أي زر متاح؛ تحتوي معظم المهام على إدخال اختبار واحد فقط) .
عند الانتهاء من مهمة ما، استخدم زر "تحميل المهمة" لفتح مهمة جديدة.