Zhipu Open-Source-Modelle der GLM-4-9B-Serie: Die Fähigkeiten übertreffen LLaMA 3 8B bei weitem

Autor：Eve Cole Aktualisierungszeit：2025-01-03 20:32:01

Zhipu AI hat die Modelle der GLM-4-9B-Serie herausgebracht und damit eine neue Welle im Bereich der künstlichen Intelligenz eingeleitet. Diese Serie umfasst Basismodelle, Chat-Modelle mit unterschiedlichen Kontextlängen und visuelle Modelle. Ihre Leistung übertrifft LLaMA38B bei weitem und zeigt eine hervorragende Leistung in mehreren Auswertungen, wie z. B. Semantik, Mathematik, Argumentation, Code und Wissen . Noch bemerkenswerter ist, dass die Modelle der GLM-4-9B-Serie Open Source auf Github sind, was Entwicklern und Forschern auf der ganzen Welt wertvolle Ressourcen bietet und die Entwicklung und Anwendung der Technologie der künstlichen Intelligenz erheblich fördert.

Zhipu kündigte die Einführung der GLM-4-9B-Modellreihe an, darunter Basismodelle, Chat-Modelle mit unterschiedlichen Kontextlängen und visuelle Modelle, deren Fähigkeiten die von LLaMA38B in allen Aspekten übertreffen. Berichten zufolge wurden die Modelle der GLM-4-9B-Serie als Open Source auf Github bereitgestellt, was die Aufmerksamkeit einer großen Anzahl von Entwicklern und Forschern auf sich zog. Die Veröffentlichung dieser Modellreihe gilt als weiterer wichtiger Durchbruch für Zhipu Company auf dem Gebiet der künstlichen Intelligenz.

GLM-4-9B ist die Open-Source-Version der von Zhipu AI eingeführten Pre-Training-Modellreihe GLM-4 der neuesten Generation. Bei der Auswertung verschiedener Datensätze wie Semantik, Mathematik, Argumentation, Code und Wissen zeigten GLM-4-9B und seine auf menschliche Präferenzen ausgerichtete Version GLM-4-9B-Chat beide eine hervorragende Leistung über Llama-3-8B hinaus.

GLM-4-9B-Chat ist nicht nur in der Lage, mehrere Gesprächsrunden durchzuführen, sondern verfügt auch über erweiterte Funktionen wie Webbrowsing, Codeausführung, Aufruf benutzerdefinierter Tools (Funktionsaufruf) und Langtextbegründung (unterstützt bis zu 128 KB Kontext). .

Dieses Generationsmodell bietet mehrsprachige Unterstützung und unterstützt 26 Sprachen, darunter Japanisch, Koreanisch und Deutsch. Wir haben außerdem das Modell GLM-4-9B-Chat-1M eingeführt, das eine Kontextlänge von 1 Mio. (ca. 2 Millionen chinesische Zeichen) unterstützt, sowie das multimodale Modell GLM-4V-9B, das auf GLM-4-9B basiert.

GLM-4V-9B ist in der Lage, zweisprachige Dialoge in Chinesisch und Englisch mit einer hohen Auflösung von 1120*1120 durchzuführen. Dabei werden umfassende Chinesisch- und Englischkenntnisse, Wahrnehmungsdenken, Texterkennung, Diagrammverständnis und andere Aspekte bewertet , GLM-4V-9B belegte den ersten Platz. Es zeigt eine hervorragende Leistung über GPT-4-turbo-2024-04-09, Gemini1.0Pro, Qwen-VL-Max und Claude3Opus hinaus.

Internetnutzer äußerten die Hoffnung, dass die Modelle der GLM-4-9B-Serie der Entwicklung der Technologie der künstlichen Intelligenz neue Impulse verleihen können, und freuen sich auf die Einführung intelligenterer Produkte. Gleichzeitig brachten sie auch ihre Wertschätzung für die technische Stärke und Innovationsfähigkeit von Zhipu zum Ausdruck.

Open-Source-Adresse: https://github.com/THUDM/GLM-4

Adresse für Modellerfahrung: https://modelscope.cn/studios/dash-infer/GLM-4-Chat-DashInfer-Demo/summary

Die Open-Source-Modelle der GLM-4-9B-Serie werden den offenen Austausch und die Entwicklung der Technologie der künstlichen Intelligenz weiter fördern. Wir freuen uns darauf, weitere innovative Anwendungen auf der Grundlage dieses Modells zu sehen. Die kontinuierlichen Durchbrüche der Zhipu-KI haben dem Bereich der künstlichen Intelligenz zweifellos neue Dynamik verliehen.