Modèles de la série Zhipu open source GLM-4-9B : les capacités dépassent largement celles du LLaMA 3 8B

Auteur：Eve Cole Date de mise à jour：2025-01-03 20:32:01

Zhipu AI a lancé les modèles de la série GLM-4-9B, déclenchant une nouvelle vague dans le domaine de l'intelligence artificielle. Cette série comprend des modèles de base, des modèles Chat avec différentes longueurs de contexte et des modèles visuels. Ses performances surpassent largement LLaMA38B et montrent d'excellentes performances dans plusieurs évaluations, telles que la sémantique, les mathématiques, le raisonnement, le code et les connaissances. . Ce qui est encore plus remarquable, c'est que les modèles de la série GLM-4-9B ont été open source sur Github, fournissant des ressources précieuses aux développeurs et aux chercheurs du monde entier et favorisant grandement le développement et l'application de la technologie de l'intelligence artificielle.

Zhipu a annoncé le lancement de la série de modèles GLM-4-9B, comprenant des modèles de base, des modèles Chat avec différentes longueurs de contexte et des modèles visuels, avec des capacités qui surpassent le LLaMA38B dans tous les aspects. Il est rapporté que les modèles de la série GLM-4-9B ont été open source sur Github, attirant l'attention d'un grand nombre de développeurs et de chercheurs. La sortie de cette série de modèles est considérée comme une autre avancée importante pour la société Zhipu dans le domaine de l'intelligence artificielle.

GLM-4-9B est la version open source de la série GLM-4 de modèle de pré-formation de dernière génération lancée par Zhipu AI. Dans l'évaluation de divers ensembles de données tels que la sémantique, les mathématiques, le raisonnement, le code et les connaissances, GLM-4-9B et sa version alignée sur les préférences humaines, GLM-4-9B-Chat, ont tous deux montré d'excellentes performances au-delà de Llama-3-8B.

En plus de pouvoir mener plusieurs séries de conversations, GLM-4-9B-Chat dispose également de fonctions avancées telles que la navigation Web, l'exécution de code, l'appel d'outils personnalisés (appel de fonction) et le raisonnement de texte long (prenant en charge jusqu'à 128 Ko de contexte). .

Ce modèle de génération ajoute une prise en charge multilingue, prenant en charge 26 langues, dont le japonais, le coréen et l'allemand. Nous avons également lancé le modèle GLM-4-9B-Chat-1M qui prend en charge une longueur de contexte de 1 million (environ 2 millions de caractères chinois) et le modèle multimodal GLM-4V-9B basé sur GLM-4-9B.

GLM-4V-9B est capable d'effectuer un dialogue multi-tours bilingue en chinois et en anglais à une haute résolution de 1120*1120 dans l'évaluation multimodale des capacités complètes en chinois et en anglais, du raisonnement perceptuel, de la reconnaissance de texte, de la compréhension des diagrammes et d'autres aspects. , GLM-4V-9B classé premier Il affiche d'excellentes performances au-delà de GPT-4-turbo-2024-04-09, Gemini1.0Pro, Qwen-VL-Max et Claude3Opus.

Les internautes ont exprimé l'espoir que les modèles de la série GLM-4-9B puissent donner un nouvel élan au développement de la technologie de l'intelligence artificielle et attendent avec impatience de voir l'avènement de produits plus intelligents. Dans le même temps, ils ont également exprimé leur appréciation pour la force technique et les capacités d'innovation de Zhipu.

Adresse open source : https://github.com/THUDM/GLM-4

Adresse de l'expérience du modèle : https://modelscope.cn/studios/dash-infer/GLM-4-Chat-DashInfer-Demo/summary

L'open source des modèles de la série GLM-4-9B favorisera davantage le partage ouvert et le développement de la technologie de l'intelligence artificielle. Nous sommes impatients de voir émerger davantage d'applications innovantes basées sur ce modèle. Les percées continues de Zhipu AI ont sans aucun doute injecté une nouvelle vitalité dans le domaine de l’intelligence artificielle.