Google a publié son dernier modèle de langage Gemma22B. Ce modèle de 2 milliards de paramètres a démontré d'excellentes performances sur plusieurs plates-formes matérielles. Il a obtenu des résultats impressionnants dans le classement Chatbot Arena, surpassant de nombreux concurrents et correspondant même à des modèles plus grands. En plus de ses puissantes performances, Gemma22B est également équipé du classificateur de sécurité ShieldGemma et des outils Gemma Scope pour garantir la sécurité et la transparence du modèle et permettre aux chercheurs d'analyser en profondeur son processus de prise de décision. Cette version marque une étape importante pour Google dans le domaine de l'IA et met en évidence la concurrence féroce sur le grand marché des modèles linguistiques.
Google a officiellement lancé son modèle Gemma22B, un modèle doté de 2 milliards de paramètres qui démontre d'excellentes performances dans une variété d'environnements matériels. En plus du modèle puissant lui-même, Google a également lancé le classificateur de sécurité ShieldGemma pour filtrer les contenus nuisibles et a fourni l'outil Gemma Scope permettant aux chercheurs d'analyser le processus décisionnel du modèle.
Les performances de Gemma22B dans le classement « Chatbot Arena » sont particulièrement accrocheuses. Avec un score élevé de 1 130, elle a réussi à surpasser de nombreux concurrents, dont GPT-3.5-Turbo-0613 et Mixtral-8x7b, et peut même rivaliser avec des dizaines de fois plus. taille de ses modèles à affronter. Grâce à l'optimisation de la bibliothèque NVIDIA TensorRT-LLM, Gemma22B est très efficace en termes de déploiement et convient à une variété de scénarios, des appareils de pointe aux environnements cloud puissants. Cela le rend adapté à une utilisation dans les centres de données, les postes de travail locaux et les applications d’IA de pointe.
Dans le contexte du développement rapide de la technologie de l’IA, cette nouvelle version de Google constitue sans aucun doute une avancée importante dans une concurrence féroce. À cet égard, Rebecca Weiss, directrice exécutive de ML Commons, a déclaré qu'à mesure que la technologie de l'IA mûrit, l'ensemble du secteur doit investir davantage de ressources dans le développement d'outils d'évaluation de sécurité hautes performances et attend avec impatience les efforts continus de Google dans ce domaine.
De plus, la sortie de Gemma22B coïncide avec le lancement par Meta de Llama3.1, qui surpasse également le GPT-4o d'OpenAI dans la plupart des tests de référence. OpenAI a également publié la semaine dernière le GPT-4o mini, plus rentable, qui est 30 fois inférieur au GPT-40 et 60 % moins cher que le GPT-3.5Turbo.
La concurrence sur le marché actuel des grands modèles de langage (LLM) devient de plus en plus féroce. Si Google veut continuer à s'implanter, il doit intensifier ses efforts d'innovation et lancer un Gemma3 plus compétitif.
Points forts:
Le modèle Gemma22B possède 2 milliards de paramètres et offre d'excellentes performances dans plusieurs environnements matériels. Il a surpassé de nombreux modèles tels que le GPT-3.5-Turbo dans le domaine des robots de discussion.
Le nouveau modèle est équipé du classificateur de sécurité ShieldGemma et des outils Gemma Scope pour aider les chercheurs à effectuer le filtrage de contenu et l'analyse des décisions.
Dans le contexte d'une concurrence de plus en plus féroce dans le secteur de l'IA, Google doit accélérer le lancement de Gemma3 pour maintenir sa compétitivité sur le marché.
Dans l’ensemble, l’émergence de Gemma22B constitue une avancée importante dans le domaine des modèles de langage à grande échelle, qui a démontré des avantages significatifs en termes de performances, de sécurité et d’efficacité de déploiement. Cependant, face à un environnement de marché extrêmement concurrentiel, Google doit continuer à innover afin de conserver sa position de leader. Le succès de Gemma22B fournit également une nouvelle référence pour l’orientation future du développement de modèles de langage à grande échelle.