OpenAI a lancé un nouveau modèle d'IA économique, le GPT-4o mini. Son coût a été considérablement réduit mais ses performances ne sont pas inférieures. Il marque une étape clé vers une application plus large de la technologie de l'IA. Cet article examinera les avantages en termes de performances, de sécurité et de prix du GPT-4o mini, ainsi que son impact sur le développement futur de l'IA.
OpenAI a fait un autre grand pas en avant : son dernier GPT-4o mini est considéré comme le petit modèle « le plus abordable ». Il ne s’agit pas simplement d’une mise à niveau d’un modèle, mais du début d’une révolution intelligente. Aujourd'hui, dévoilons le mystère du GPT-4o mini et voyons comment il peut rendre l'intelligence plus « ancrée ».
Soyez plus intelligent et économisez de l'argent
La vision d'OpenAI est de créer de l'intelligence partout, et GPT-4o mini est la dernière mise en œuvre de cette vision. Ce modèle est non seulement nettement inférieur en termes de coût, mais également en termes de performances. À seulement 15 cents par million de jetons d'entrée et 60 cents par million de jetons de sortie, c'est un ordre de grandeur moins cher que les modèles de pointe précédents et plus de 60 % moins cher que le GPT-3.5 Turbo.
Petite stature, grande sagesse
GPT-4o mini surpasse le GPT-3.5 Turbo et d'autres petits modèles dans les tests académiques, à la fois pour l'intelligence textuelle et le raisonnement multimodal. Il prend également en charge la même gamme de langages que GPT-4o et excelle dans les appels de fonctions, ce qui permet aux développeurs de créer des applications capables d'obtenir des données ou d'effectuer des opérations avec des systèmes externes et s'améliore par rapport à GPT-3.5 Turbo. Performances de contexte long améliorées.
Sur les benchmarks clés, GPT-4o mini a réalisé les performances suivantes :
Tâches de raisonnement : dans les tâches de raisonnement impliquant du texte et de la vision, GPT-4o mini a obtenu un score de 82,0 %, contre 77,9 % pour Gemini Flash et 73,8 % pour Claude Haiku.
Mathématiques et capacité de codage : GPT-4o mini a également bien performé dans les tâches de raisonnement mathématique et de codage. Au test MGSM (raisonnement mathématique), il a obtenu un score de 87,0 %, contre 75,5 % pour Gemini Flash et 71,7 % pour Claude Haiku. Au test HumanEval (performance d'encodage), il a obtenu un score de 87,2 %, contre 71,5 % pour Gemini Flash et 75,9 % pour Claude Haiku.
Raisonnement multimodal : dans MMMU (Multimodal Reasoning Evaluation), GPT-4o mini a obtenu un score de 59,4 %, tandis que Gemini Flash a obtenu un score de 56,1 % et Claude Haiku un score de 50,2 %.
Mesures de sécurité intégrées
La sécurité est toujours au cœur du développement du modèle openAI. Au cours de la phase de pré-formation, openAI filtre les informations qu'il ne souhaite pas que le modèle apprenne ou génère, telles que les discours de haine, le contenu réservé aux adultes, les sites Web qui regroupent principalement des informations personnelles et le spam. Après la formation, openAI utilise des techniques telles que l'apprentissage par renforcement et le retour humain (RLHF) pour aligner le comportement du modèle sur les politiques d'openAI et améliorer la précision et la fiabilité de la réponse du modèle.
GPT-4o mini présente les mêmes mesures d'atténuation de sécurité intégrées à GPT-4o, qu'openAI a soigneusement évaluées grâce à une évaluation automatisée et humaine basée sur le cadre de préparation d'origine et les engagements volontaires. Plus de 70 experts externes dans des domaines tels que la psychologie sociale et la désinformation ont testé GPT-4o pour identifier les risques potentiels, qu'openAI a maintenant abordés et prévoit d'inclure dans les prochains détails de la carte système GPT-4o et de la carte de score de préparation. Les informations issues de ces évaluations d'experts ont contribué à améliorer la sécurité de GPT-4o et GPT-4o mini.
Disponibilité et prix
GPT-4o mini est désormais disponible dans l'API Assistant, l'API Chat Completion et l'API Batch sous forme de modèles textuels et visuels. Les développeurs paient 15 cents par million de jetons d'entrée et 60 cents par million de jetons de sortie (environ l'équivalent de 2 500 pages dans un livre standard). Nous prévoyons de déployer des capacités de réglage fin pour GPT-4o mini dans les prochains jours.
Dans ChatGPT, les utilisateurs Free, Plus et Team pourront accéder à GPT-4o mini à partir d'aujourd'hui, en remplacement de GPT-3.5. Les utilisateurs d’entreprise y auront également accès à partir de la semaine prochaine, conformément à la mission d’openAI de rendre les avantages de l’IA accessibles à tous.
perspectives d'avenir
L’équipe OpenAI a déclaré : « Au cours des dernières années, nous avons assisté à des progrès significatifs en matière d’intelligence artificielle tout en réduisant considérablement les coûts. Par exemple, depuis le lancement du modèle text-davinci-003 moins puissant en 2022, le coût par unité de GPT-4o mini. le jeton a chuté de 99 %. Nous nous engageons à continuer de réduire les coûts tout en améliorant les capacités du modèle.
« Nous envisageons un avenir dans lequel les modèles seront intégrés de manière transparente dans chaque application et chaque site Web. GPT-4o mini ouvre la voie aux développeurs pour créer et faire évoluer de puissantes applications d'IA de manière plus efficace et plus abordable. intégrés dans nos expériences numériques quotidiennes, et nous sommes ravis de continuer à mener la charge.
Dans l'ensemble, GPT-4o mini fournit une base solide pour la vulgarisation des applications d'IA avec ses excellentes performances, son prix économique et ses mesures de sécurité solides, indiquant que la technologie d'IA sera plus largement intégrée dans nos vies.