أصدرت Google مؤخرًا أحدث إصدار من نموذج Lightweight Language Open Open Source Gemma2 ، والذي يوفر مقياسين للمعلمة: 9 مليارات (9B) و 27 مليار (27B). مقارنةً بنماذج الجيل السابق GEMMA ، قامت GEMMA2 بتحسين أداء الأداء وسرعة الاستدلال بشكل كبير ، مما يوفر للباحثين والمطورين أدوات معالجة لغوية أكثر كفاءة.
بوابة المنتج: https://top.aibase.com/tool/google-gemma-2
يعتمد GEMMA2 على تطوير نموذج GEMINI من Google ويركز على مجال معالجة اللغة ، بهدف تزويد الباحثين والمطورين بوصول أكثر ملاءمة. على عكس الخصائص متعددة الوسائط ومتعددة اللغات لنموذج الجوزاء ، يركز GEMMA2 على تحسين سرعة وكفاءة معالجة اللغة ، مما يجعلها أفضل في مهمة واحدة.
لا يتجاوز GEMMA2 فقط الجيل السابق GEMMA1 في الأداء ، ولكنه يتنافس أيضًا مع نماذج واسعة النطاق. النموذج مرن في التصميم ويمكن أن يعمل بكفاءة في مجموعة متنوعة من بيئات الأجهزة ، بما في ذلك أجهزة الكمبيوتر المحمولة وأجهزة الكمبيوتر المكتبية وأجهزة إنترنت الأشياء والمنصات المحمولة. يؤدي تحسين GPU و TPU على وجه الخصوص إلى أداء GEMMA2 بشكل جيد على الأجهزة المقيدة للموارد. على سبيل المثال ، يكون طراز 27B قادرًا على تشغيل الاستدلال بكفاءة على GPU Core Core Nvidia H100 واحد ، مما يوفر للمطورين خيارًا عالي الأداء وبأسعار معقولة.
بالإضافة إلى ذلك ، يوفر GEMMA2 للمطورين قدرات ضبط غنية ، ودعم مجموعة متنوعة من المنصات والأدوات. سواء كانت Google Cloud المستندة إلى مجموعة النظراء أو منصة Axolotl الشهيرة ، تقدم GEMMA2 مجموعة واسعة من خيارات التأكيد. من خلال التكامل مع منصات مثل Hugging Face و Nvidia Tensorrt-LLM و Jax و Keras من Google ، يمكن للباحثين والمطورين تحقيق الأداء الأمثل في مجموعة متنوعة من تكوينات الأجهزة ونشر النماذج بكفاءة.
بالمقارنة مع طراز LLAMA3 70B ، كان أداء GEMMA2 جيدًا. على الرغم من صغر حجم المعلمات ، فإن أداء GEMMA2 27B مماثل لتلك الخاصة بـ LLAMA3 70B. بالإضافة إلى ذلك ، يتفوق GEMMA2 9B دائمًا على LLAMA3 8B في المعايير مثل فهم اللغة والترميز وحل المشكلات الرياضية ، مما يدل على قدراته القوية في مجموعة متنوعة من المهام.
GEMMA2 لديه مزايا كبيرة في التعامل مع اللغات الهندية. تم تصميم Segmenter Word الخاص به للغات الهندية ويحتوي على 256 ألف رمز يمكن أن يلتقط الفروق الدقيقة في اللغة. في المقابل ، على الرغم من أن LLAMA3 يؤدي بشكل جيد في الدعم متعدد اللغات ، إلا أنه يعاني من صعوبات في رمز النصوص الهندية بسبب القيود في بيانات المفردات والتدريب. وهذا يجعل GEMMA2 أكثر فائدة عند التعامل مع مهام اللغة الهندية ويصبح الخيار الأفضل للمطورين والباحثين في المجالات ذات الصلة.
لدى GEMMA2 مجموعة واسعة من سيناريوهات التطبيق العملي ، بما في ذلك المساعدين متعدد اللغات والأدوات التعليمية ومساعدة الترميز وأنظمة خرقة. على الرغم من أن GEMMA2 حقق تقدمًا كبيرًا في العديد من الجوانب ، إلا أنه لا يزال يواجه تحديات في تدريب جودة البيانات والقدرة والدقة متعددة اللغات ، ويحتاج إلى مزيد من التحسين والتحسين.
النقاط الرئيسية:
يعد GEMMA2 أحدث نموذج لغة مفتوح المصدر من Google ، حيث يوفر أدوات معالجة لغوية أسرع وأكثر كفاءة.
يعتمد النموذج على بنية محول وحدة فك الترميز ، والمدربة مسبقًا باستخدام طريقة تقطير المعرفة ، وزيادة ضبطها من خلال ضبط التعليمات.
تتمتع GEMMA2 بمزايا في التعامل مع اللغات الهندية وهي مناسبة لسيناريوهات التطبيق العملية مثل المساعدين متعدد اللغات والأدوات التعليمية ومساعدة الترميز وأنظمة الخرقة.