أطلقت Microsoft مؤخرًا نموذجًا لغة صغير يسمى PHI-4 على منصة الوجه المعانقة كنماذج مفتوحة المصدر مثل QWEN2.5 و LLAMA-3.1. يوضح هذا الإنجاز الذي حقق ذلك الإمكانات القوية لـ PHI-4 في مجال معالجة اللغة.
في اختبار مسابقة الرياضيات الأمريكية AMC ، برزت PHI-4 برصيد 91.8 ، أفضل بكثير من المنافسين مثل Gemini Pro1.5 و Claude3.5sonnet. بالإضافة إلى ذلك ، في اختبار MMLU ، حققت PHI-4 درجة عالية من 84.8 ، مما يدل بالكامل على قدرتها المتميزة في التفكير والمعالجة الرياضية. هذه الإنجازات ليست مثيرة للإعجاب فحسب ، بل تضع أيضًا أساسًا متينًا لـ PHI-4 لاستخدامه في التطبيقات المستقبلية.
على عكس العديد من النماذج التي تعتمد على مصادر البيانات العضوية ، تعتمد PHI-4 طرقًا مبتكرة لتوليد البيانات الاصطناعية ، بما في ذلك المطالبات متعددة الوكلاء ، وانعكاسات التعليمات ، والتصحيح الذاتي. تعمل هذه الأساليب على تحسين أداء PHI-4 بشكل كبير في المهام المعقدة ، مما يجعلها أكثر كفاءة ودقة في التعامل مع التفكير وحل المشكلات. توفر استراتيجية توليد البيانات الفريدة هذه دعمًا مهمًا لنجاح PHI-4.
تعتمد PHI-4 بنية محول Decoder فقط ، مما يدعم أطوال السياق حتى 16 ألف ، مما يجعلها مثالية لمعالجة بيانات الإدخال على نطاق واسع. خلال عملية ما قبل التدريب ، استخدمت PHI-4 حوالي 10 تريليونات الرموز ، حيث تجمع بين البيانات الاصطناعية والبيانات العضوية التي يتم فحصها بدقة ، مما يضمن أداءً ممتازًا في الاختبارات القياسية مثل MMLU و Humaneval. هذه الهندسة المعمارية واستراتيجية البيانات الفعالة تميز PHI-4 عن نماذج مماثلة.
تتضمن ميزات ومزايا PHI-4 الانضغاطية والكفاءة ، مما يسمح لها بالتشغيل على أجهزة المستهلكين ؛ الأجيال والنماذج الأكبر. يمكن للمطورين أيضًا دمج PHI-4 بسهولة من خلال وثائق مفصلة وواجهة برمجة التطبيقات (APIs) على منصة الوجه المعانقة لتوسيع سيناريوهات التطبيق الخاصة بهم.
فيما يتعلق بالابتكار التكنولوجي ، يعتمد تطوير PHI-4 بشكل أساسي على ثلاثة أعمدة: متعددة الوكلاء وتقنيات التصحيح الذاتي لتوليد البيانات الاصطناعية ، وطرق تعزيز ما بعد التدريب مثل أخذ عينات الرفض وتحسين التفضيل المباشر (DPO) ، وصرامة بيانات التدريب التي تمت تصفيتها. بالإضافة إلى ذلك ، تستخدم PHI-4 البحث عن العلامات الرئيسية (PTS) لتحديد العقد المهمة في عملية صنع القرار ، وبالتالي تحسين قدرتها على التعامل مع مهام الاستدلال المعقدة. توفر هذه الابتكارات التكنولوجية أساسًا تقنيًا قويًا لنجاح PHI-4.
مع المصدر المفتوح لـ PHI-4 ، أصبحت توقعات المطورين حقيقة. لا يتوفر هذا النموذج فقط للتنزيل على منصة Hugging Face ، ولكنه يدعم أيضًا الاستخدام التجاري بموجب ترخيص MIT. اجتذبت هذه السياسة المفتوحة انتباه عدد كبير من المطورين وعشاق الذكاء الاصطناعى ، وهنأت وسائل التواصل الاجتماعي الرسمية في Face ، ووصفها بأنها "أفضل نموذج 14B في التاريخ". المصدر المفتوح لـ PHI-4 لا يوفر للمطورين أدوات قوية فحسب ، بل يوفر أيضًا حيوية جديدة في الابتكار في مجال الذكاء الاصطناعي.
مدخل النموذج: https://huggingface.co/Microsoft/Phi-4
النقاط الرئيسية:
** أطلقت Microsoft نموذج المعلمة الصغيرة PHI-4 ، مع معلمات 14 مليار فقط ، لكنها تجاوزت العديد من النماذج المعروفة. **
** كان أداء PHI-4 جيدًا في اختبارات الأداء المتعددة ، وخاصة في الرياضيات والتفكير. **
PHI-4 الآن مفتوح المصدر ويدعم الاستخدام التجاري ، وجذب انتباه واستخدام العديد من المطورين.