Llama 3.1، هذا النموذج اللغوي العملاق مفتوح المصدر الذي يضم 405 مليار معلمة، أحدث صدمة كبيرة في مجال الذكاء الاصطناعي بسبب التسريبات دون إصدار رسمي. أداءه قوي جدًا لدرجة أنه يتفوق على GPT-4o في بعض الاختبارات المعيارية، مما يضع معيارًا جديدًا للنماذج مفتوحة المصدر. تثبت المناقشة الساخنة حول Reddit تأثيرها على مجتمع الذكاء الاصطناعي. سوف تتعمق هذه المقالة في الأداء والميزات وإجراءات السلامة الخاصة بـ Llama 3.1 وتكشف النقاب عن هذا النموذج الغامض.
لقد تم تسريب Llama3.1! لقد سمعت ذلك بشكل صحيح، لقد تسبب هذا النموذج مفتوح المصدر الذي يحتوي على 405 مليار معلمة في إثارة ضجة على موقع Reddit. ربما يكون هذا هو أقرب نموذج مفتوح المصدر إلى GPT-4o حتى الآن، بل ويتفوق عليه في بعض الجوانب.
Llama3.1 هو نموذج لغة كبير تم تطويره بواسطة Meta (فيسبوك سابقًا). على الرغم من عدم وجود إصدار رسمي حتى الآن، إلا أن النسخة المسربة تسببت بالفعل في إثارة ضجة في المجتمع. لا يتضمن هذا النموذج النموذج الأساسي فحسب، بل يشتمل أيضًا على النتائج المعيارية لـ 8B و70B والمعلمة القصوى 405B.
مقارنة الأداء: Llama3.1 مقابل GPT-4o
انطلاقًا من نتائج المقارنة المسربة، حتى الإصدار 70B من Llama3.1 تجاوز GPT-4o في اختبارات قياس متعددة. هذه هي المرة الأولى التي يصل فيها نموذج مفتوح المصدر إلى مستوى SOTA (حالة الفن، التكنولوجيا الأكثر تقدمًا) وفقًا لمعايير متعددة. لا يمكن للناس إلا أن يتنهدوا: إن قوة المصدر المفتوح قوية حقًا!
أبرز مميزات النموذج: دعم متعدد اللغات، وبيانات تدريب أكثر ثراءً
يستخدم نموذج Llama3.1 15T+ من الرموز المميزة من المصادر العامة للتدريب، والموعد النهائي لبيانات ما قبل التدريب هو ديسمبر 2023. وهو لا يدعم اللغة الإنجليزية فحسب، بل يدعم أيضًا الفرنسية والألمانية والهندية والإيطالية والبرتغالية والإسبانية والتايلاندية. وهذا يجعلها رائعة في حالات استخدام المحادثة متعددة اللغات.
يولي فريق بحث Llama3.1 أهمية كبيرة لأمن النموذج. لقد استخدموا نهجًا متعدد الأوجه لجمع البيانات يجمع بين البيانات التي أنشأها الإنسان والبيانات الاصطناعية للتخفيف من المخاطر الأمنية المحتملة. بالإضافة إلى ذلك، يقدم النموذج أيضًا مطالبات حدودية ومطالبات عدائية لتعزيز مراقبة جودة البيانات.
مصدر بطاقة النموذج: https://pastebin.com/9jGkYbXY#google_vignette
لا شك أن تسرب Llama 3.1 سيكون له تأثير عميق على مجال الذكاء الاصطناعي. فهو لا يوضح الإمكانات الهائلة للنماذج مفتوحة المصدر فحسب، بل يؤدي أيضًا إلى مزيد من التفكير حول أمن النماذج والقضايا الأخلاقية. في المستقبل، سنواصل الاهتمام بـ Llama 3.1 وتطورها اللاحق، ونتطلع إلى جلب المزيد من المفاجآت لتقدم تكنولوجيا الذكاء الاصطناعي.