بعد إصدار Meta لـ Llama 3.1، أطلقت Mistral AI نموذجها الرئيسي Mistral Large 2، بحجم معلمة يبلغ 123 مليارًا، ونافذة سياق مذهلة تبلغ 128 كيلو بايت، وأداء مشابه لـ Llama 3.1. يدعم النموذج لغات ولغات برمجة متعددة، وهو مصمم للاستدلال على عقدة واحدة، وهو فعال وصديق للتكلفة. ستلقي هذه المقالة نظرة متعمقة على مؤشرات الأداء المتنوعة لـ Mistral Large 2، وطرق الاستخدام، وأدائها الممتاز في المعالجة متعددة اللغات، وفهم التعليمات البرمجية، ومتابعة التعليمات، وتحليل إمكاناتها في التطبيقات التجارية ومجالات البحث.
بعد إعلان Meta بالأمس عن إطلاق أقوى نموذج مفتوح المصدر Llama3.1، أطلقت Mistral AI بشكل رائع نموذجها الرئيسي Mistral Large2 في وقت مبكر من هذا الصباح. يحتوي هذا المنتج الجديد على 123 مليار معلمة ونافذة سياق كبيرة تبلغ 128 كيلو بايت في هذا الصدد قابلة للمقارنة مع Llama3.1.
تفاصيل طراز ميسترال Large2
يحتوي Mistral Large2 على نافذة سياق بحجم 128 كيلو بايت ويدعم عشرات اللغات بما في ذلك الفرنسية والألمانية والإسبانية والإيطالية والبرتغالية والعربية والهندية والروسية والصينية واليابانية والكورية، بالإضافة إلى Python وJava وC وC++، وأكثر من 80 لغة ترميز بما في ذلك JavaScript وBash.
تم تصميم Mistral Large2 للاستدلال على عقدة واحدة، واستهداف التطبيقات ذات السياق الطويل - حيث يتيح حجم المعلمة البالغ 123 مليارًا تشغيله بمعدل إنتاجية عالي على عقدة واحدة. يتم إصدار ميسترال لارج 2 بموجب ترخيص أبحاث ميسترال وهو مخصص للبحث والاستخدام غير التجاري، إذا كانت هناك حاجة تجارية، يحتاج المستخدمون إلى الاتصال للحصول على ترخيص تجاري؛
الأداء العام:
من حيث الأداء، أنشأت ميسترال لارج2 معيارًا جديدًا في مؤشرات التقييم، لا سيما تحقيق دقة قدرها 84.0% في اختبار قياس MMLU، مما يدل على توازن قوي بين الأداء وتكلفة الخدمة.
الكود والمنطق
من خلال الخبرة التدريبية لـ Codestral22B وCodestral Mamba، يعمل Mistral Large2 بشكل جيد في معالجة التعليمات البرمجية، حتى أنه يمكن مقارنته بالنماذج الأعلى مثل GPT-4o وClude3Opus وLlama3405B.
الامتثال للتعليمات والمواءمة
كما حققت ميسترال لارج 2 تقدمًا كبيرًا في متابعة الأوامر وقدرات الحوار، خاصة عند التعامل مع الحوارات المعقدة ومتعددة المنعطفات بمرونة أكبر. في بعض المعايير، يؤدي توليد استجابات أطول إلى تحسين النتائج. ومع ذلك، في العديد من التطبيقات التجارية، تعد البساطة أمرًا بالغ الأهمية - حيث يساعد إنشاء نموذج أقصر على تفاعلات أسرع ويجعل الاستدلال أكثر فعالية من حيث التكلفة.
التنوع اللغوي
تم تدريب ميسترال لارج 2 الجديد على كميات كبيرة من البيانات متعددة اللغات، وتحديدًا باللغات الإنجليزية والفرنسية والألمانية والإسبانية والإيطالية والبرتغالية والهولندية والروسية والصينية واليابانية والكورية والعربية والهندية بأداء ممتاز. فيما يلي نتائج أداء Mistral Large2 على معيار MMLU متعدد اللغات، مقارنة بنماذج Mistral Large السابقة وLlama3.1 وCohere's Command R+.
استخدام الأداة واستدعاءات الوظائف
يأتي Mistral Large2 مزودًا بمهارات محسنة لاستدعاء الوظائف واسترجاعها، كما تم تدريبه على تنفيذ استدعاءات الوظائف المتوازية والمتسلسلة بخبرة، مما يمكنه من العمل كمصدر قوة لتطبيقات الأعمال المعقدة.
كيفية الاستخدام:
حاليًا، يمكن للمستخدمين استخدام Mistral Large2 تحت اسم mistral-large-2407
a la Plateforme (https://console.mistral.ai/) واختباره على le Chat. وهو متوفر في الإصدار 24.07 (نظام التحكم في الإصدار YY.MM الذي نطبقه على جميع الطرازات) وتحت اسم واجهة برمجة التطبيقات (API) mistral-large-2407
. تتوفر أوزان نموذج التعليمات ويتم استضافتها أيضًا على HuggingFace (https://huggingface.co/mistralai/Mistral-Large-Instruct-2407).
تشتمل المنتجات الموجودة على La Plateforme على نموذجين عالميين، Mistral Nemo وMistral Large، ونموذجين احترافيين، Codestral وEmbed. نظرًا لأننا نتخلص تدريجيًا من النماذج القديمة في La Plateforme، لا يزال من الممكن نشر جميع نماذج Apache (Mistral7B وMixtral8x7B و8x22B وCodestral Mamba وMathstral) وضبطها بدقة باستخدام استدلال SDK ميسترال وضبط ميسترال.
بدءًا من اليوم، سيعمل المنتج على توسيع قدرات الضبط الدقيق على غرار Plateforme: هذه الإمكانات متاحة الآن لـ Mistral Large وMistral Nemo وCodestral.
كما دخلت Mistral AI في شراكة مع العديد من مقدمي الخدمات السحابية الرائدين لجعل Mistral Large2 متاحًا عالميًا، ولا سيما في Vertex AI على Google Cloud Platform.
** أبرز النقاط: **
يحتوي Mistral Large2 على نوافذ سياقية تبلغ 128 ألفًا ويدعم ما يصل إلى عشر لغات وأكثر من 80 لغة برمجة.
تحقيق دقة تصل إلى 84.0% في اختبار MMLU المعياري، مع أداء وتكلفة ممتازين.
?يمكن للمستخدمين الوصول إلى النماذج الجديدة من خلال La Plateforme ويتم استخدامها على نطاق واسع على منصات الخدمة السحابية.
بشكل عام، أظهر ميسترال لارج 2 قدرة تنافسية قوية في مجال نماذج اللغات الكبيرة بفضل أدائه القوي ودعمه اللغوي الواسع واستخدامه المريح، مما يوفر إمكانيات جديدة للبحث والتطبيقات التجارية. كما تعمل طبيعتها مفتوحة المصدر على تعزيز التطوير المبتكر في مجال الذكاء الاصطناعي.