علم محرر Downcodes أن دراسة متقدمة في جامعة ييل كشفت سر التدريب على نماذج الذكاء الاصطناعي: تعقيد البيانات ليس أعلى، بل كان ذلك أفضل، ولكن هناك حالة "حافة الفوضى" المثالية. استخدم فريق البحث بذكاء نموذج الإنسان الآلي الخلوي لإجراء التجارب، واستكشف تأثير البيانات ذات التعقيد المختلف على تأثير التعلم لنموذج الذكاء الاصطناعي، وتوصل إلى استنتاجات ملفتة للنظر.
أصدر فريق بحث من جامعة ييل مؤخرًا نتيجة بحثية رائدة، كشفت عن نتيجة رئيسية في التدريب على نماذج الذكاء الاصطناعي: البيانات التي تتمتع بأفضل تأثير تعلم للذكاء الاصطناعي ليست أبسط أو أكثر تعقيدًا، ولكن هناك مستوى تعقيد مثالي - وهي حالة تُعرف باسم "الذكاء الاصطناعي". حافة الفوضى.
أجرى فريق البحث تجارب باستخدام أجهزة خلوية أولية (ECAs)، وهي أنظمة بسيطة تعتمد فيها الحالة المستقبلية لكل وحدة على نفسها وعلى حالة وحدتين متجاورتين فقط. وعلى الرغم من بساطة القواعد، فإن مثل هذه الأنظمة يمكن أن تنتج أنماطًا متنوعة تتراوح من البسيطة إلى شديدة التعقيد. ثم قام الباحثون بتقييم أداء هذه النماذج اللغوية في مهام التفكير والتنبؤ بحركات الشطرنج.
تظهر نتائج الأبحاث أن نماذج الذكاء الاصطناعي المدربة على قواعد ECA الأكثر تعقيدًا تؤدي أداءً أفضل في المهام اللاحقة. على وجه الخصوص، أظهرت النماذج التي تم تدريبها على ECAs من الدرجة الرابعة في تصنيف Wolfram أفضل أداء. الأنماط الناتجة عن مثل هذه القواعد ليست مرتبة تمامًا ولا فوضوية تمامًا، ولكنها تظهر تعقيدًا منظمًا.
ووجد الباحثون أنه عندما تعرضت النماذج لأنماط بسيطة للغاية، فإنها غالبًا ما تعلمت حلولًا بسيطة فقط. في المقابل، تعمل النماذج المدربة على أنماط أكثر تعقيدًا على تطوير قدرات معالجة أكثر تعقيدًا حتى عند توفر حلول بسيطة. ويتوقع فريق البحث أن تعقيد هذا التمثيل المكتسب هو عامل رئيسي في قدرة النموذج على نقل المعرفة إلى مهام أخرى.
قد يفسر هذا الاكتشاف سبب كفاءة نماذج اللغات الكبيرة مثل GPT-3 وGPT-4. ويعتقد الباحثون أن البيانات الضخمة والمتنوعة المستخدمة في تدريب هذه النماذج ربما خلقت تأثيرات مشابهة لأنماط ECA المعقدة في دراستهم.
يقدم هذا البحث أفكارًا جديدة لتدريب نماذج الذكاء الاصطناعي ومنظورًا جديدًا لفهم القدرات القوية لنماذج اللغات الكبيرة. في المستقبل، ربما يمكننا تحسين الأداء وقدرات التعميم لنماذج الذكاء الاصطناعي من خلال التحكم بشكل أكثر دقة في تعقيد بيانات التدريب. ويعتقد محرر موقع Downcodes أن نتيجة البحث هذه سيكون لها تأثير عميق على مجال الذكاء الاصطناعي.