قامت Anthropic بترقية نماذج سلسلة Claude 3.5، مما يسمح لك بتشغيل الكمبيوتر مثل الإنسان!

الكاتب：Eve Cole وقت التحديث：2024-12-09 17:48:01

علم محرر Downcodes أن شركة الذكاء الاصطناعي Anthropic قامت بترقية سلسلة موديلات Claude 3.5 وأطلقت Claude 3.5 Sonnet وClaude 3.5 Haiku الجديدين. الميزة الأساسية لهذه الترقية هي أنها تعمل على تحسين قدرات البرمجة بشكل كبير وتمنح كلود القدرة على محاكاة العمليات البشرية على أجهزة الكمبيوتر، مما يمثل خطوة Anthropic المهمة في توسيع نماذج الذكاء الاصطناعي التجارية إلى "وكلاء الذكاء الاصطناعي" الشاملين. ارتفعت نتيجة Sonnet في اختبار SWE-bench Verified إلى 49.0%، متجاوزة جميع النماذج المتاحة للجمهور، بما في ذلك نموذج المعاينة o1 الخاص بـ OpenAI. يؤدي أداء Haiku جيدًا في العديد من الاختبارات المعيارية الذكية مع سرعة أكبر وقدرات متابعة أوامر أكثر دقة. ستوفر هذه الترقية أدوات مساعدة أكثر قوة للذكاء الاصطناعي وتجربة أكثر ملاءمة للمطورين والمستخدمين.

أعلنت شركة الذكاء الاصطناعي Anthropic عن ترقيات كبيرة لسلسلة موديلات Claude 3.5، بما في ذلك Claude 3.5 Sonnet وClaude 3.5 Haiku الجديد. تدعي النسخة التي تمت ترقيتها أنها تسمح للذكاء الاصطناعي بالسيطرة على جهاز الكمبيوتر الخاص بك، وأداء المهام الأساسية مثل محاكاة إدخال لوحة المفاتيح ونقرات الماوس لاستخدام أي تطبيق مثبت على جهاز الكمبيوتر الخاص بك.

تم تحسين قدرات الترميز بشكل كبير، متجاوزة نموذج معاينة OpenAI o1

تم تحسين Claude3.5Sonnet الجديد بشكل كبير في جميع الجوانب، خاصة فيما يتعلق بقدرات الترميز. ارتفعت درجتها في اختبار SWE-bench Verified من 33.4% إلى 49.0%، متجاوزة جميع النماذج المتاحة للجمهور، بما في ذلك نموذج المعاينة o1 الخاص بـ OpenAI.

بالإضافة إلى ذلك، تحسن أداءها على TAU-bench، خاصة في قطاعي البيع بالتجزئة والطيران. كل هذا مع الحفاظ على نفس السعر والسرعة مثل سابقتها.

تظهر تعليقات العملاء أن Claude3.5Sonnet الذي تمت ترقيته قد حقق قفزة نوعية في تشفير الذكاء الاصطناعي. على سبيل المثال، اختبر GitLab هذا النموذج لمهام DevSecOps ووجد تحسينات كبيرة في قدرات التفكير دون زيادة زمن الوصول.

Claude3.5Haiku هو أسرع طراز من الجيل التالي لكلود ، ويتفوق على Claude3Opus بنفس التكلفة والسرعة، ويحقق أداءً جيدًا في العديد من المعايير الذكية، خاصة في مهام التشفير. إن زمن الوصول المنخفض لـ Claude3.5Haiku وقدرات متابعة الأوامر الأكثر دقة يجعلها مناسبة جدًا لإنشاء منتجات واجهة المستخدم والتجارب الشخصية.

تشغيل أجهزة الكمبيوتر مثل الإنسان

تعد وظيفة استخدام الكمبيوتر التي تم إطلاقها حديثًا بمثابة محاولة جديدة تمامًا . يقول المسؤولون إن هذا لا يهدف إلى تطوير أدوات محددة لكلود، ولكن لتعليمه مهارات الكمبيوتر العامة حتى يتمكن من استخدام مجموعة متنوعة من الأدوات والبرامج القياسية. يمكن للمطورين استخدام هذه الإمكانية لأتمتة العمليات المتكررة، وإنشاء البرامج واختبارها، وإجراء الأبحاث المفتوحة، والمزيد.

وبطبيعة الحال، لا تزال قدرة كلود الحالية على استخدام أجهزة الكمبيوتر بحاجة إلى التحسين. لا تزال بعض العمليات البسيطة، مثل التمرير والسحب، تمثل تحديًا لكلود. ولضمان السلامة، قام المسؤولون أيضًا بتطوير مصنف جديد يمكنه تحديد ما إذا كان استخدام الكمبيوتر قد تسبب في ضرر محتمل.

وقال جاريد كابلان، كبير المسؤولين العلميين في Anthropic، في مقابلة: "نحن على وشك الدخول في عصر جديد حيث يمكن للذكاء الاصطناعي الاستفادة من جميع الأدوات التي تستخدمها كفرد لإنجاز المهام". لقد تم اتخاذ خطوة مهمة في توسيع نطاق الذكاء الاصطناعي التجاري نماذج من أطر الدردشة التقليدية إلى "وكلاء الذكاء الاصطناعي" على نطاق واسع.

في أحد العروض التوضيحية، طُلب من كلود التخطيط لرحلة لصديق لمشاهدة شروق الشمس فوق جسر البوابة الذهبية. لم يفتح الذكاء الاصطناعي صفحة الويب فحسب، بل وجد أيضًا مكانًا مناسبًا للعرض على Google وأضف خط سير الرحلة إلى تطبيق التقويم. في حين أن هذا الأداء مثير للإعجاب، تشير Wired إلى أنها لا توفر بعض المعلومات الإضافية، مثل كيفية الوصول إلى وجهتك.

بالإضافة إلى ذلك، في عرض توضيحي آخر، طُلب من كلود إنشاء موقع ويب بسيط، ونتيجة لذلك، نجح في إنشاء موقع ويب باستخدام Visual Studio Code من Microsoft وفتح الخادم المحلي للاختبار. ومع ذلك، على طول الطريق، واجه بعض الأخطاء الطفيفة ولكنه نجح في إصلاح الكود عند المطالبة بذلك.

أظهر Claude 3.5 Sonne قدرته على أداء مهام متعددة الخطوات على منصات برمجية مختلفة من خلال استرداد المعلومات المطلوبة من نظام إدارة علاقات العملاء (CRM) لإكمال نموذج طلب المورد بشكل مستقل.

أصبح Claude3.5Sonnet الذي تمت ترقيته متاحًا الآن لجميع المستخدمين. بدءًا من اليوم، يمكن للمطورين البناء باستخدام الإصدار التجريبي للكمبيوتر على Anthropic API وAmazon Bedrock وVertex AI من Google Cloud. سيتم إصدار Claude3.5Haiku الجديد في وقت لاحق من هذا الشهر.

المدونة الرسمية: https://www.anthropic.com/news/3-5-models-and-computer-use

تسليط الضوء على:

تمت ترقية طرازي Claude3.5Sonnet وHaiku بشكل كبير، كما تم تحسين قدرات الترميز الخاصة بهما بشكل كبير.

تتيح وظيفة استخدام الكمبيوتر التي تم إطلاقها حديثًا لكلود تشغيل الكمبيوتر مثل الإنسان، مما يفتح المزيد من الإمكانيات.

يؤدي استخدام مساعدي الذكاء الاصطناعي إلى مخاطر تتعلق بالسلامة، وتؤكد الأنثروبيك على المراقبة والتحسين التدريجيين لضمان السلامة.

بشكل عام، توضح ترقية نموذج سلسلة Claude 3.5 من Anthropic التطور السريع لتكنولوجيا الذكاء الاصطناعي وتشير أيضًا إلى أن الذكاء الاصطناعي سيلعب دورًا أكثر قوة في المزيد من المجالات في المستقبل. وعلى الرغم من أنه لا تزال هناك بعض التحديات، إلا أن آفاق التنمية تستحق التطلع إليها. سيستمر محرر Downcodes في الاهتمام بأحدث التطورات في هذا المجال وتقديم المزيد من التقارير المثيرة للقراء.