Google a récemment publié la dernière version de son modèle de langage léger open source GEMMA2, qui fournit deux échelles de paramètres: 9 milliards (9b) et 27 milliards (27b). Par rapport aux modèles GEMMA de la génération précédente, Gemma2 a considérablement amélioré les performances et la vitesse d'inférence, offrant aux chercheurs et aux développeurs des outils de traitement du langage plus efficaces.
Portail de produit: https://top.aibase.com/tool/google-gemma-2
Gemma2 est basé sur le développement du modèle Gémeaux de Google et se concentre sur le domaine du traitement du langage, visant à fournir aux chercheurs et aux développeurs un accès plus pratique. Contrairement aux caractéristiques multimodales et multilingues du modèle GEMINI, GEMMA2 se concentre sur l'amélioration de la vitesse et de l'efficacité du traitement du langage, ce qui le rend meilleur sur une seule tâche.
GEMMA2 dépasse non seulement la génération précédente GEMMA1 en performance, mais rivalise également avec des modèles à plus grande échelle. Le modèle est flexible dans la conception et peut fonctionner efficacement dans une variété d'environnements matériels, y compris les ordinateurs portables, les ordinateurs de bureau, les appareils IoT et les plates-formes mobiles. L'optimisation pour un seul GPU et TPU en particulier fait que GEMMA2 fonctionne bien sur les appareils liés aux ressources. Par exemple, le modèle 27b est capable d'exécuter efficacement l'inférence sur un seul hôte NVIDIA H100 Tensor Core ou TPU, offrant aux développeurs une option haute performance et abordable.
De plus, GEMMA2 offre aux développeurs des capacités de réglage riches, soutenant une variété de plates-formes et d'outils. Qu'il s'agisse de Google Cloud basé sur le cloud ou de la plate-forme Axolotl populaire, GEMMA2 offre une large gamme d'options de réglage fin. Grâce à l'intégration avec des plates-formes telles que Hugging Face, Nvidia Tensorrt-llm et Jax et Keras de Google, les chercheurs et les développeurs sont en mesure d'obtenir des performances optimales dans une variété de configurations matérielles et de déployer efficacement les modèles.
En comparaison avec le modèle LLAMA3 70B, GEMMA2 a bien fonctionné. Malgré la petite taille des paramètres, les performances du GEMMA2 27b sont comparables à celles du LLAMA3 70B. De plus, le GEMMA2 9B surpasse toujours le LLAMA3 8B dans des références telles que la compréhension du langage, le codage et la résolution de problèmes mathématiques, démontrant ses capacités puissantes dans une variété de tâches.
GEMMA2 a des avantages importants dans le traitement des langues indiennes. Son segmentateur de mots est conçu pour les langues indiennes et contient des jetons 256K qui peuvent capturer des nuances de la langue. En revanche, bien que LLAMA3 fonctionne bien dans le support multilingue, il a des difficultés à tokensiiser les scripts hindi en raison de limitations de données de vocabulaire et de formation. Cela rend GEMMA2 plus avantageux lorsqu'il s'agit de tâches de langue indienne et devient le meilleur choix pour les développeurs et les chercheurs dans des domaines connexes.
Gemma2 possède un large éventail de scénarios d'application pratiques, notamment des assistants multilingues, des outils éducatifs, une assistance au codage et des systèmes de chiffon. Bien que Gemma2 ait fait des progrès significatifs sous de nombreux aspects, il est toujours confronté à des défis dans la formation des données, la capacité et la précision multilingues, et nécessite une optimisation et une amélioration supplémentaires.
Points clés:
GEMMA2 est le dernier modèle de langue open source de Google, fournissant des outils de traitement du langage plus rapides et plus efficaces.
Le modèle est basé sur l'architecture du convertisseur de décodeur, pré-formé à l'aide de la méthode de distillation des connaissances, et encore affiné à travers le réglage des instructions.
GEMMA2 a des avantages à gérer les langues indiennes et convient aux scénarios d'application pratiques tels que les assistants multilingues, les outils éducatifs, l'assistance au codage et les systèmes de chiffon.