Microsoft lance une nouvelle série de modèles d'IA Phi-3.5, battant Google, OpenAI, etc.

Auteur：Eve Cole Date de mise à jour：2024-12-22 16:16:02

Microsoft a récemment publié trois puissants modèles d'IA Phi-3.5, à savoir Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct et Phi-3.5-vision-instruct, ciblant respectivement le raisonnement léger et les experts hybrides et les tâches multimodales. sont optimisés. Cela marque une avancée significative de Microsoft dans le domaine de l'intelligence artificielle multilingue et multimodale, renforçant ainsi sa position de leader dans ce domaine. Les trois modèles sont publiés sous licence open source MIT, offrant aux développeurs un large éventail de possibilités d'application.

Microsoft a annoncé la sortie de trois nouveaux modèles Phi-3.5, consolidant ainsi sa position de leader dans le développement d'intelligence artificielle multilingue et multimodale. Les trois nouveaux modèles sont : Phi-3.5-mini-instruct, -3.5-MoE-instruct et Phi-3.5-vision-instruct, chacun ciblant différents scénarios d'application.

Le modèle Phi-3.5Mini Instruct est un modèle d'IA léger avec 380 millions de paramètres, très adapté aux environnements à puissance de calcul limitée. Il prend en charge une longueur de contexte de 128 Ko et est spécifiquement optimisé pour les capacités d'exécution d'instructions, ce qui le rend adapté aux tâches telles que la génération de code, la résolution de problèmes mathématiques et le raisonnement logique. Malgré sa petite taille, ce modèle fait preuve d'une compétitivité impressionnante dans les tâches de dialogue multilingues et multitours, surpassant les autres modèles de sa catégorie.

Entrée : https://huggingface.co/microsoft/Phi-3.5-mini-instruct

Le modèle Phi-3.5MoE, un modèle « hybride expert », combine plusieurs types de modèles différents, chacun axé sur une tâche spécifique. Il comporte 41,9 milliards de paramètres et prend en charge une longueur de contexte de 128 Ko, ce qui peut démontrer de puissantes performances dans une variété de tâches de raisonnement. Ce modèle fonctionne très bien en matière de code, de mathématiques et de compréhension multilingue, surpassant même des modèles plus grands dans certains benchmarks, comme le GPT-4o d'OpenAI dans MMLU (Massive Multi-Task Language Understanding) mini.

Entrée : https://huggingface.co/microsoft/Phi-3.5-MoE-instruct

Le modèle Phi-3.5Vision Instruct est un modèle d'IA multimodal avancé qui intègre des capacités de traitement de texte et d'image et convient à des tâches telles que la compréhension d'images, la reconnaissance optique de caractères, l'analyse de graphiques et de tableaux et le résumé vidéo. Ce modèle prend également en charge une longueur de contexte de 128 Ko et peut gérer des tâches complexes de vision multi-images.

Entrée : https://huggingface.co/microsoft/Phi-3.5-vision-instruct

Afin de former ces trois modèles, Microsoft a procédé à un traitement de données à grande échelle. Le modèle Mini Instruct a utilisé 3,4 billions de marqueurs et a été formé sur 512 GPU H100-80G pendant 10 jours ; le modèle Vision Instruct a utilisé 500 milliards de marqueurs et a été formé sur 6 jours et le modèle MoE a été utilisé en 23 jours, 4,9 billions de marqueurs ont été utilisés ; pour la formation.

Il convient de mentionner que ces trois modèles Phi-3.5 sont tous publiés sous la licence open source MIT et que les développeurs peuvent librement utiliser, modifier et distribuer ces logiciels. Cela reflète non seulement le soutien de Microsoft à la communauté open source, mais permet également à davantage de développeurs d'intégrer des capacités d'IA de pointe dans leurs applications.

Souligner:

Microsoft a lancé trois nouveaux modèles d'IA, ciblant le raisonnement léger, les tâches expertes hybrides et multimodales.

?Phi-3.5MoE surpasse le GPT-4o mini dans les tests de référence et fonctionne bien.

? Les trois modèles sont sous licence open source MIT, et les développeurs peuvent les utiliser et les modifier librement.

Dans l'ensemble, les trois modèles Phi-3.5 lancés par Microsoft, avec leurs performances puissantes, leur large gamme de scénarios d'application et leurs licences ouvertes, auront sans aucun doute un impact profond sur le domaine de l'intelligence artificielle et fourniront aux développeurs et aux chercheurs des outils puissants. annoncent également la nouvelle direction du développement futur de la technologie de l’IA.