سيأخذك محرر Downcodes للتعرف على أحدث الإنجازات التي حققها باحثو Meta! لقد استخدموا نموذج المحول للتغلب على مشكلة طويلة الأمد لم يتم حلها في مجال الأنظمة الديناميكية - وهي العثور على وظيفة Lyapunov العالمية. لا يوضح هذا البحث القدرات القوية لنماذج اللغة واسعة النطاق في التفكير الرياضي المعقد فحسب، بل الأهم من ذلك أنه يقترح طريقة مبتكرة "للجيل العكسي" تحل بشكل فعال مشكلة عدم كفاية بيانات التدريب وتمهد الطريق للذكاء الاصطناعي في الاكتشافات العلمية. لقد فتحت التطبيقات فيه آفاقًا جديدة. تم نشر نتائج البحث على arXiv، وتم توفير عنوان الورقة.
تؤدي النماذج اللغوية الكبيرة أداءً جيدًا في العديد من المهام، لكن قدراتها المنطقية كانت مثيرة للجدل. نشر الباحثون في Meta مؤخرًا ورقة بحثية توضح كيفية استخدامهم لنموذج Transformer لحل مشكلة طويلة الأمد في الرياضيات: اكتشاف وظيفة Lyapunov العالمية للنظام الديناميكي.
يمكن لدالة ليابونوف تحديد ما إذا كان النظام الديناميكي مستقرًا، على سبيل المثال، يمكن استخدامها للتنبؤ بالاستقرار طويل المدى لمشكلة الأجسام الثلاثة، أي المسار طويل المدى للأجرام السماوية الثلاثة تحت تأثير الجاذبية. . ومع ذلك، لم يتم العثور على طريقة عامة لاشتقاق دالة ليابونوف، والدالة المقابلة لها معروفة فقط في عدد قليل من الأنظمة.
لحل هذه المشكلة، قام الباحثون في Meta بتدريب نموذج محول تسلسل إلى تسلسل للتنبؤ بوظيفة Lyapunov لنظام معين. لقد استخدموا بشكل مبتكر نهج "التوليد العكسي" لإنشاء مجموعة بيانات تدريب كبيرة تحتوي على أنظمة ديناميكية مستقرة ووظائف ليابونوف المقابلة لها.
تبدأ طريقة "الجيل الأمامي" التقليدية من نظام يتم إنشاؤه عشوائيًا وتحاول حساب دالة Lyapunov الخاصة به. هذه الطريقة غير فعالة ولا يمكنها التعامل إلا مع أنواع معينة من الأنظمة البسيطة. تقوم طريقة "التوليد العكسي" أولاً بإنشاء وظائف Lyapunov بشكل عشوائي ثم بناء نظام مستقر يتوافق معها، وبالتالي تجاوز مشكلة حساب وظائف Lyapunov وتوليد بيانات تدريب أكثر تنوعًا.
وجد الباحثون أن نموذج المحول الذي تم تدريبه على مجموعة بيانات "التوليد العكسي" حقق دقة شبه مثالية في مجموعة الاختبار (99%)، كما كان أداؤه جيدًا أيضًا في مجموعة الاختبار خارج التوزيع (73%). والأكثر إثارة للدهشة هو أنه من خلال إضافة عدد صغير (300) من الأمثلة البسيطة لـ "الجيل المتقدم" إلى مجموعة التدريب، يمكن تحسين دقة النموذج بشكل أكبر إلى 84٪، مما يوضح أنه حتى عدد صغير من الحلول المعروفة يمكن تحسين دقة النموذج بشكل كبير. تحسين قدرة تعميم النموذج.
ولاختبار قدرة النموذج على اكتشاف وظائف لابونوف الجديدة، أنشأ الباحثون عشرات الآلاف من الأنظمة العشوائية واستخدموا النموذج لإجراء تنبؤات. أظهرت النتائج أن النموذج حقق نجاحًا أكبر بعشر مرات في العثور على دوال ليابونوف على الأنظمة متعددة الحدود مقارنة بالطرق الحديثة، ويمكنه أيضًا العثور على دوال ليابونوف على الأنظمة غير متعددة الحدود، وهو أمر لا تستطيع أي خوارزمية حالية القيام به قليل.
وقام الباحثون أيضًا بمقارنة النموذج مع علماء الرياضيات من البشر، ودعوا 25 طالب ماجستير في الرياضيات لإجراء اختبار، وأظهرت النتائج أن دقة النموذج كانت أعلى بكثير من دقة النموذج لدى البشر.
يوضح هذا البحث أنه يمكن تدريب نماذج المحولات على حل مشكلات التفكير الرياضي المعقدة وأن أساليب "التوليد العكسي" يمكنها إنشاء مجموعات بيانات تدريبية بشكل فعال تتغلب على قيود الأساليب التقليدية. ويخطط الباحثون في المستقبل لتطبيق هذه الطريقة على مشاكل رياضية أخرى واستكشاف المزيد من إمكانيات الذكاء الاصطناعي في الاكتشافات العلمية.
عنوان الورقة: https://arxiv.org/pdf/2410.08304
وبشكل عام، توفر أبحاث ميتا أفكارًا وأساليب جديدة للذكاء الاصطناعي لحل المشكلات العلمية المعقدة، وتشير أيضًا إلى أن الذكاء الاصطناعي سيلعب دورًا متزايد الأهمية في مجال البحث العلمي. سيستمر محرر Downcodes في الاهتمام بأحدث التطورات في مجال الذكاء الاصطناعي وتقديم المزيد من التقارير المثيرة للقراء!