أطلقت شركة Cognition مبرمج الذكاء الاصطناعي المذهل Genie، والذي تغلب على Devin وGPT-4 بنتيجة 30.08% على منصة الاختبار الموثوقة SWE-Bench، ليصبح أقوى مساعد برمجة للذكاء الاصطناعي في العالم. سيمنحك محرر Downcodes فهمًا متعمقًا للاختراقات التكنولوجية والآفاق المستقبلية وراء Genie.
أطلقت شركة AI الناشئة Cognition مبرمج الذكاء الاصطناعي الجديد "Genie". وأدائه مذهل، وقد هزم Devin وGPT-4 على الفور وأصبح أقوى مساعد برمجة للذكاء الاصطناعي في العالم.
سجل مبرمج الذكاء الاصطناعي هذا نسبة عالية تصل إلى 30.08% على منصة الاختبار الموثوقة SWE-Bench، وهو ما يتجاوز بكثير نسبة Devin البالغة 13.8% ونسبة Swe-agent+GPT-4 البالغة 12.47%.
ربما تتساءل، كيف تقوم شركة Genie بذلك؟ في وقت مبكر من ديسمبر 2022، قام أليستر بولين، المؤسس المشارك لشركة Genie، بعرض هذا المشروع في جامعة لندن. إنه يأمل في إنشاء برنامج ذكاء اصطناعي يمكنه تلقائيًا البرمجة والتصحيح والتحسين مثل البشر. وبعد أكثر من عام من التطوير، دخلت Genie أخيرًا مرحلة الاختبار وحصلت على 2.5 مليون دولار أمريكي في جولة تمويل أولية.
ذكر أليستر أن نجاح جيني يرتبط ارتباطًا وثيقًا ببيانات وأساليب التدريب الخاصة بها. على عكس الضبط الدقيق التقليدي للنماذج الكبيرة، تستخدم Genie مجموعة بيانات خاصة تتضمن عملية التفكير التي يقوم بها المبرمجون البشريون. تغطي البيانات اكتشاف المعرفة خطوة بخطوة وعملية اتخاذ القرار على أساس الحالة، مما يسمح لشركة Genie بإظهار حكم مماثل لحكم المهندس البشري عند مواجهة مشكلات معقدة.
بالإضافة إلى ذلك، يستخدم Genie أيضًا "آلية التحسين الذاتي" الفريدة. في البداية، تدربت جيني على بيانات عالية الجودة ووصلت إلى حالة "مثالية"، ولكن في هذه العملية، فشلت جيني في الحكم على أخطائها وفشلت في التحسن. للتغلب على هذه المشكلة، استخدم المطورون Genie لإنشاء بعض البيانات الاصطناعية لإثراء محتوى التدريب بشكل أكبر. وهذا مثل الأم التي تعلم طفلها المشي وتعطيه التوجيه الصحيح بعد كل سقوط.
بعد العديد من تكرارات التدريب، تحسنت قدرات جيني بشكل كبير، ويمكنها أيضًا إظهار حلول إبداعية للمشكلات غير المرئية. من الناحية الوظيفية، تدعم Genie مجموعة متنوعة من مهام التطوير، بما في ذلك تطوير الوظائف وإصلاح الأخطاء وإعادة بناء التعليمات البرمجية واختبار التعليمات البرمجية وما إلى ذلك، وتغطي العشرات من لغات البرمجة مثل JavaScript وPython وJava.
الآن، قامت Genie بفتح تطبيقات للاستخدام التجريبي، ويمكنك التسجيل من خلال الموقع الرسمي ومن المتوقع أن يتم إصدار أذونات الاختبار في الأسابيع القليلة المقبلة.
المدونة الرسمية: https://cosine.sh/blog/state-of-the-art
عنوان الخبرة: https://cosine.sh/register
تسليط الضوء على:
سجل جيني ما يصل إلى 30.08% في اختبار SWE-Bench، ليصبح أقوى مبرمج ذكاء اصطناعي في العالم.
باستخدام مجموعات البيانات الخاصة وآليات التحسين الذاتي، تتفوق Genie في البرمجة المعقدة.
طلب الإصدار التجريبي مفتوح حاليًا، وسيتم إطلاق المزيد من الميزات المفاجئة في المستقبل!
يمثل ظهور Genie طفرة جديدة في مجال مساعدي برمجة الذكاء الاصطناعي. تستحق طريقة التدريب الفريدة وآلية التحسين الذاتي اهتمام الصناعة. يتطلع محرر Downcodes إلى أن تقدم Genie المزيد من المفاجآت للمطورين في المستقبل!