أعلنت شركة IBM عن إطلاق الجيل الجديد من نموذج اللغة الكبير مفتوح المصدر Granite3.1، بهدف قيادة مجال الذكاء الاصطناعي على مستوى المؤسسات. يحتوي Granite3.1 على العديد من الميزات المميزة، بما في ذلك طول السياق الممتد إلى 128 كيلو بايت، ونماذج التضمين الفعالة، وقدرات الكشف عن الهلوسة المضمنة، والأداء العام المحسن بشكل ملحوظ. وفقًا لشركة IBM، فإن نموذج Granite8B Instruct الخاص بها يحقق أفضل أداء بين النماذج مفتوحة المصدر من نفس الحجم، متجاوزًا المنافسين مثل Meta's Llama3.1 وQwen2.5 وGemma2 من Google. يأتي إصدار هذا النموذج الجديد في أعقاب إطلاق Granite 3.0 في أكتوبر، مما يعكس التكرار السريع لشركة IBM واستثمارها المستمر في مجال الذكاء الاصطناعي التوليدي، مع وصول إيرادات الأعمال ذات الصلة إلى 2 مليار دولار أمريكي.
أصدرت شركة IBM رسميًا جيلها الجديد من نموذج اللغة الكبير مفتوح المصدر Granite3.1، وتسعى جاهدة لاحتلال مكانة رائدة في مجال الذكاء الاصطناعي على مستوى المؤسسة. تتميز هذه السلسلة من النماذج بطول سياق ممتد يصل إلى 128 كيلو بايت، ونماذج مضمنة، وقدرات مدمجة للكشف عن الهلوسة، وتحسينات كبيرة في الأداء.
تدعي شركة IBM أن نموذج Granite8B Instruct يحقق أفضل أداء بين المنافسين مفتوحي المصدر من نفس الحجم، بما في ذلك Meta's Llama3.1 وQwen2.5 وGemma2 من Google.
يأتي إصدار نموذج Granite3.1 على خلفية التكرار السريع لسلسلة Granite3.0 التي أطلقتها شركة IBM في وقت مبكر من شهر أكتوبر. كشفت شركة IBM أن إيرادات أعمالها المتعلقة بتوليد الذكاء الاصطناعي وصلت إلى 2 مليار دولار. الفكرة الأساسية للإصدار الجديد هي دمج المزيد من الوظائف في نموذج أصغر بحيث يمكن تشغيله بسهولة أكبر وفعالية من حيث التكلفة لمستخدمي الأعمال.
وقال ديفيد كوكس، نائب رئيس أبحاث IBM، إن نموذج Granite يستخدم على نطاق واسع في منتجات IBM الداخلية والخدمات الاستشارية وخدمات العملاء، ويتم إصداره أيضًا في شكل مفتوح المصدر، لذلك يحتاج إلى الوصول إلى مستوى عالٍ في جميع الجوانب. لا يعتمد تقييم أداء النموذج على السرعة فحسب، بل على الكفاءة أيضًا، مما يساعد المستخدمين على توفير الوقت عند الحصول على النتائج.
فيما يتعلق بطول السياق، فإن تحسين Granite3.1 واضح بشكل خاص، ويمتد من الإصدار الأول من 4K إلى 128K، وهو أمر مهم بشكل خاص لمستخدمي الذكاء الاصطناعي في المؤسسات، خاصة فيما يتعلق بالتوليد المعزز للاسترجاع (RAG) والذكاء الاصطناعي للوكيل الذكي. يسمح طول السياق الممتد للنموذج بمعالجة المستندات والسجلات والمحادثات الأطول، مما يسمح له بفهم الاستعلامات المعقدة والرد عليها بشكل أفضل.
أطلقت شركة IBM أيضًا سلسلة من نماذج التضمين لتسريع عملية تحويل البيانات إلى ناقلات. من بينها، وقت الاستعلام لنموذج Granite-Embedding-30M-English هو 0.16 ثانية، وهو أسرع من منتجات المنافسين. من أجل تحقيق تحسين أداء Granite3.1، ابتكرت شركة IBM في عملية التدريب متعددة المراحل واستخدام بيانات التدريب عالية الجودة.
فيما يتعلق باكتشاف الهلوسة، يدمج نموذج Granite3.1 الحماية من الهلوسة في النموذج، والذي يمكنه الكشف الذاتي وتقليل المخرجات الزائفة. يعمل هذا الكشف المدمج على تحسين الكفاءة الإجمالية وتقليل عدد مكالمات الاستدلال.
حاليًا، نموذج Granite3.1 مفتوح لمستخدمي المؤسسات مجانًا ويتم توفيره من خلال خدمة Watsonx Enterprise AI من IBM. في المستقبل، تخطط IBM للحفاظ على وتيرة سريعة للتحديثات، وسيقوم Granite 3.2 بإطلاق وظائف متعددة الوسائط في أوائل عام 2025.
المدونة الرسمية: https://www.ibm.com/new/announcements/ibm-granite-3-1-powerful-performance-long-context-and-more
تسليط الضوء على:
أطلقت شركة IBM نموذج Granite3.1، بهدف احتلال مكانة رائدة في سوق نماذج اللغات الكبيرة مفتوحة المصدر.
يدعم الطراز الجديد طول سياق يبلغ 128 كيلو بايت، مما يؤدي إلى تحسين قدرات المعالجة وكفاءتها بشكل ملحوظ.
تم دمج قدرات اكتشاف الوهم في النموذج، مما يعمل على تحسين الأداء العام والدقة.
بشكل عام، يمثل إصدار Granite3.1 تقدمًا كبيرًا آخر لشركة IBM في مجال نماذج اللغات الكبيرة مفتوحة المصدر، وسيوفر أدائها القوي ووظائفها الغنية تجربة ذكاء اصطناعي أكثر ملاءمة وكفاءة لمستخدمي المؤسسات. التكرارات المستقبلية تستحق التطلع إليها.