أصدرت Microsoft مؤخرًا ثلاثة نماذج قوية من Phi-3.5 AI، وهي Phi-3.5-mini-instruct، وPhi-3.5-MoE-instruct، وPhi-3.5-vision-instruct، والتي تستهدف خبراء التفكير الخفيف والخبراء المختلطين على التوالي تم تحسينها. ويمثل هذا تقدمًا كبيرًا لمايكروسوفت في مجال الذكاء الاصطناعي متعدد اللغات ومتعدد الوسائط، مما يعزز مكانتها الرائدة في هذا المجال. تم إصدار جميع النماذج الثلاثة بموجب ترخيص MIT مفتوح المصدر، مما يوفر للمطورين مجموعة واسعة من إمكانيات التطبيقات.
أعلنت شركة مايكروسوفت عن إطلاق ثلاثة نماذج جديدة من طراز Phi-3.5، مما يعزز مكانتها الرائدة في تطوير الذكاء الاصطناعي متعدد اللغات ومتعدد الوسائط. النماذج الثلاثة الجديدة هي: Phi-3.5-mini-instruct، و-3.5-MoE-instruct، وPhi-3.5-vision-instruct، ويستهدف كل منها سيناريوهات تطبيق مختلفة.
يعد نموذج Phi-3.5Mini Instruct نموذجًا خفيف الوزن للذكاء الاصطناعي يحتوي على 380 مليون معلمة، وهو مناسب جدًا للبيئات ذات القدرة الحاسوبية المحدودة. وهو يدعم طول سياق يبلغ 128 كيلو بايت وتم تحسينه خصيصًا لإمكانيات تنفيذ التعليمات، مما يجعله مناسبًا لمهام مثل إنشاء التعليمات البرمجية وحل المشكلات الرياضية والتفكير المنطقي. وعلى الرغم من صغر حجمه، إلا أن هذا النموذج يُظهر قدرة تنافسية مثيرة للإعجاب في مهام الحوار متعدد اللغات ومتعددة الأدوار، متجاوزًا النماذج الأخرى في فئته.
المدخل: https://huggingface.co/microsoft/Phi-3.5-mini-instruct
يجمع نموذج Phi-3.5MoE، وهو نموذج "هجين خبير"، بين عدة أنواع مختلفة من النماذج، يركز كل منها على مهمة محددة. يحتوي على 41.9 مليار معلمة ويدعم طول سياق يصل إلى 128 كيلو بايت، مما يمكنه إظهار أداء قوي في مجموعة متنوعة من مهام التفكير المنطقي. يؤدي هذا النموذج أداءً جيدًا للغاية في البرمجة والرياضيات والفهم متعدد اللغات، حتى أنه يتفوق على النماذج الأكبر في بعض المعايير، مثل تجاوز OpenAI's GPT-4o في MMLU (فهم لغة متعدد المهام الضخم) المصغر.
المدخل: https://huggingface.co/microsoft/Phi-3.5-MoE-instruct
يعد نموذج Phi-3.5Vision Instruct نموذجًا متقدمًا متعدد الوسائط للذكاء الاصطناعي يدمج إمكانات معالجة النصوص والصور وهو مناسب لمهام مثل فهم الصور والتعرف البصري على الأحرف وتحليل المخططات والجداول وتلخيص الفيديو. يدعم هذا النموذج أيضًا طول سياق يبلغ 128 كيلو بايت ويمكنه التعامل مع مهام الرؤية المعقدة متعددة الإطارات.
المدخل: https://huggingface.co/microsoft/Phi-3.5-vision-instruct
من أجل تدريب هذه النماذج الثلاثة، قامت Microsoft بمعالجة البيانات على نطاق واسع. استخدم نموذج Mini Instruct 3.4 تريليون علامة وتم تدريبه على 512 وحدة معالجة رسوميات H100-80G لمدة 10 أيام؛ واستخدم نموذج Vision Instruct 500 مليار علامة وتم تدريبه على 6 أيام، وتم استخدام نموذج MoE في 23 يومًا حيث تم استخدام 4.9 تريليون علامة للتدريب.
ومن الجدير بالذكر أن نماذج Phi-3.5 الثلاثة هذه تم إصدارها جميعًا بموجب ترخيص MIT مفتوح المصدر، ويمكن للمطورين استخدام هذه البرامج وتعديلها وتوزيعها بحرية. ولا يعكس هذا دعم Microsoft لمجتمع المصادر المفتوحة فحسب، بل يسمح أيضًا لمزيد من المطورين بدمج إمكانات الذكاء الاصطناعي المتطورة في تطبيقاتهم.
تسليط الضوء على:
أطلقت Microsoft ثلاثة نماذج جديدة للذكاء الاصطناعي، تستهدف التفكير الخفيف والخبير المختلط والمهام متعددة الوسائط.
يتفوق Phi-3.5MoE على GPT-4o mini في الاختبارات القياسية ويعمل بشكل جيد.
جميع النماذج الثلاثة مرخصة بموجب ترخيص MIT مفتوح المصدر، ويمكن للمطورين استخدامها وتعديلها بحرية.
وبشكل عام، فإن نماذج Phi-3.5 الثلاثة التي أصدرتها Microsoft، بأدائها القوي ومجموعة واسعة من سيناريوهات التطبيقات والتراخيص المفتوحة، سيكون لها بلا شك تأثير عميق على مجال الذكاء الاصطناعي وستزود المطورين والباحثين بأدوات قوية يبشر أيضًا بالاتجاه الجديد لتطوير تكنولوجيا الذكاء الاصطناعي في المستقبل.