أصدرت شركة Cosine الناشئة في سان فرانسيسكو للذكاء الاصطناعي أحدث طراز لها من الذكاء الاصطناعي، Genie، والذي تم تصميمه لمطوري البرامج ويؤدي أداءً جيدًا في الاختبارات المعيارية، ويحقق نتائج أعلى بكثير من منافسيه. تستفيد Cosine من متغيرات GPT-4o التي تم تدريبها بالشراكة مع OpenAI، ومن خلال إمكاناتها الفريدة "الاستدلال البشري المشفر"، تمكن Genie من إكمال مجموعة متنوعة من مهام البرمجة بشكل مستقل أو بشكل تعاوني، بما في ذلك إصلاح الأخطاء، وتطوير ميزات جديدة، وإعادة هيكلة التعليمات البرمجية. لا يمكن فصل نجاح Genie أيضًا عن طريقة Cosine الفريدة للتدريب على البيانات والاستخدام الذكي لآلية التحسين الذاتي للنموذج، والتي حققت في النهاية درجة متقدمة بنسبة 30% في اختبار SWE-Bench.
أطلقت شركة Cosine الناشئة للذكاء الاصطناعي ومقرها سان فرانسيسكو نموذجًا جديدًا للذكاء الاصطناعي يسمى Genie مصممًا لمساعدة مطوري البرامج. وفقًا للشركة، تفوقت شركة Genie بشكل كبير على المنافسين في الاختبارات المعيارية، مما أظهر قدرات متفوقة.
دخلت Cosine في شراكة مع OpenAI لتدريب متغير GPT-4o باستخدام بيانات عالية الجودة، مما أدى إلى تحقيق نتائج قياسية مبهرة. وتقول الشركة إن مفتاح نجاح Genie هو قدرتها على "تشفير التفكير البشري"، وهو ما قد لا يقتصر على عالم تطوير البرمجيات.
الجني يأخذ زمام المبادرة في SWE
كشف أليستر بولين، المؤسس المشارك والرئيس التنفيذي لشركة Cosine، أن شركة Genie حققت درجة 30% في اختبار SWE-Bench، وهي أعلى درجة حتى الآن لنموذج الذكاء الاصطناعي في هذا المجال. تتفوق هذه النتيجة على نماذج اللغات الأخرى التي تركز على البرمجة، مثل نموذج Amazon (19%) ونموذج Devin لـ Cognition (13.8% في بعض اختبارات SWE-Bench).
تم تصميم بنية Genie لمحاكاة العمليات المعرفية للمطورين البشريين، مما يمكنها من إصلاح الأخطاء وتطوير ميزات جديدة وإعادة بناء التعليمات البرمجية وتنفيذ مجموعة متنوعة من مهام البرمجة بشكل مستقل أو بشكل تعاوني.
التحسين الذاتي من خلال البيانات الاصطناعية
تم تطوير Genie باستخدام عملية خاصة قامت بتدريب وضبط متغيرات GPT-40 غير العامة باستخدام مليارات البيانات عالية الجودة. أمضى Cosine ما يقرب من عام في جمع هذه البيانات بمساعدة المطورين ذوي الخبرة. تحتوي مجموعة البيانات على 21% من JavaScript وPython، و14% من TypeScript وTSX، و3% من اللغات الأخرى بما في ذلك Java وC++ وRuby.
يرجع الأداء المتفوق لشركة Genie جزئيًا إلى تدريبها على التحسين الذاتي. في البداية، تعلم النموذج في الغالب من كود العمل المثالي، لكنه كان مرتبكًا بشأن معالجة الأخطاء الخاصة به. يحل Cosine هذه المشكلة باستخدام البيانات الاصطناعية: إذا كان الحل الذي اقترحته Genie في الأصل غير صحيح، فسيتم عرض النموذج كيفية تحسينه باستخدام النتائج الصحيحة. مع كل تكرار، تحسن حل Genie تدريجيًا وانخفض عدد المراجعات المطلوبة تدريجيًا.
التغلب على القيود التقنية
رأى بولين إمكانات نماذج اللغات الكبيرة في دعم تطوير البرمجيات البشرية في وقت مبكر من عام 2022. ومع ذلك، لم تكن التكنولوجيا في ذلك الوقت على المستوى الذي يسمح لها بتحقيق رؤية جيني. عادةً ما تكون سعة علامة نافذة السياق محدودة بـ 4000 علامة، وهو ما يمثل عنق الزجاجة الرئيسي. اليوم، يمكن لنماذج مثل Gemini 1.5 Pro التعامل مع ما يصل إلى 2 مليون علامة في موجه واحد. على الرغم من أن Cosine لم يكشف عن قدرة Genie المحددة على وضع العلامات، إلا أن هذا التقدم التكنولوجي يوفر بلا شك أساسًا متينًا لنجاح Genie.
يمثل ظهور Genie إنجازًا كبيرًا في مجال تطوير البرمجيات المدعومة بالذكاء الاصطناعي، مما يوفر إمكانات جديدة لتطوير البرمجيات في المستقبل. توفر تقنية Cosine المبتكرة أفكارًا جديدة لتحسين كفاءة تطوير البرمجيات وتقليل تكاليف التطوير، وتستحق اهتمام الصناعة وإجراء المزيد من الأبحاث.