Die Vorschauversion von GLM-Zero, dem Deep Reasoning-Modell von Intelligent Spectrum, ist online. Es eignet sich gut für Mathematik, Codierung und andere Probleme.

Autor：Eve Cole Aktualisierungszeit：2025-01-18 16:16:01

Ende des Jahres brachte Beijing Zhipu Huazhang Technology Co., Ltd. die erste Version von GLM-Zero auf den Markt, das erste auf der erweiterten Reinforcement-Learning-Technologie trainierte Inferenzmodell – GLM-Zero-Preview. Dieses Modell hat hervorragende Fähigkeiten in der mathematischen Logik, beim Schreiben von Code und beim Denken komplexer Probleme bewiesen und in mehreren maßgeblichen Bewertungen Ergebnisse erzielt, die mit ähnlichen OpenAI-Modellen vergleichbar sind. GLM-Zero-Preview verbessert nicht nur die Fähigkeiten von Expertenaufgaben, sondern sorgt auch für eine hervorragende Leistung bei allgemeinen Aufgaben und setzt damit einen neuen Maßstab für die Verbesserung der Denkfähigkeiten künstlicher Intelligenz.

Ende des Jahres veröffentlichte das Unternehmen für Beijing Zhipu Huazhang Technology Co., Ltd. sein erstes Inferenzmodell, das auf der erweiterten Reinforcement-Learning-Technologie trainiert wurde – die erste Version von GLM-Zero, GLM-Zero-Preview. Dieses Modell konzentriert sich auf die Verbesserung der Denkfähigkeiten der künstlichen Intelligenz, insbesondere in der mathematischen Logik, beim Schreiben von Code und bei der Verarbeitung komplexer Probleme, die tiefgreifendes Denken erfordern. Im Vergleich zum Basismodell hat GLM-Zero-Preview seine Fähigkeiten für Expertenaufgaben erheblich verbessert, während die allgemeinen Aufgabenfähigkeiten beibehalten wurden. Seine Leistung in AIME2024-, MATH500- und LiveCodeBench-Bewertungen entspricht der von OpenAI o1-preview.

Benutzer können GLM-Zero-Preview jetzt kostenlos im „Zero Inference Model“-Agenten der Zhipu Qingyan-Plattform erleben. Die Plattform unterstützt Text- und Bild-Uploads und das Modell gibt den vollständigen Argumentationsprozess aus. Gleichzeitig können Entwickler dieses Modell auch über die API der offenen Zhipu-Plattform aufrufen.

微信截图_20241231095302.png

Obwohl zwischen GLM-Zero-Preview und dem o3-Modell von OpenAI immer noch eine gewisse Lücke besteht, plant Zhipu Huazhang Technology Co., Ltd., die iterative Reinforcement-Learning-Technologie weiter zu optimieren und wird bald die offizielle Version von GLM-Zero herausbringen, um die Fähigkeit zu erweitern des tiefen Denkens von der mathematischen Logik bis hin zu allgemeineren Technologiebereichen.

Im Hinblick auf die Modellleistung zeigt GLM-Zero-Preview die Bedeutung des verstärkenden Lernens für die Verbesserung der Tiefenschlussfähigkeiten des Modells. Mit zunehmendem Trainingsaufwand hat sich die Leistung des Modells in Aspekten wie Deep Reasoning stetig verbessert. Das Skalierungsgesetz des Modells in der Inferenzphase wurde ebenfalls überprüft. Das heißt, je mehr Token das Modell berücksichtigen kann und desto mehr Berechnungen erforderlich sind, desto besser wird auch die Qualität der vom Modell gelieferten Ergebnisse. GLM-Zero-Preview kann während des Denkprozesses, der dem menschlichen Denk- und Entscheidungsprozess ähnelt, eine autonome Entscheidungsfindung und Problemzerlegung realisieren und mehrere Wege zur Problemlösung ausprobieren.

In tatsächlichen Testfällen demonstrierte GLM-Zero-Preview die Fähigkeit, logische Lücken zu identifizieren und mehrere Annahmen im Hinblick auf logisches Denken zu simulieren. In Bezug auf die Mathematik verfügt das Modell über starke induktive und deduktive Fähigkeiten, kann komplexe mathematische Operationen schnell verarbeiten und hat im Postgraduierten-Mathematik-I-Test 2025 das Niveau eines herausragenden Doktoranden erreicht. In Bezug auf die Programmierung kann GLM-Zero-Preview mehrere Programmiersprachen kompetent verwenden und Entwicklern helfen, schnell Code zu schreiben.

Weisheitsspektrum klare Worte:

https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh

Offene Zhipu-Plattform:

https://bigmodel.cn/dev/api/normal-model/glm-zero-preview

Die Einführung von GLM-Zero-Preview zeigt, dass Zhipu Huazhang im Bereich der künstlichen Intelligenz erhebliche Fortschritte gemacht hat. Seine kostenlose und offene Strategie erleichtert außerdem die Erfahrung und das Feedback von Entwicklern und Benutzern und liefert wertvolle Daten für die iterative Optimierung zukünftiger Modelle. Wir freuen uns auf die Veröffentlichung der offiziellen Version von GLM-Zero, um die Weiterentwicklung der Technologie der künstlichen Intelligenz weiter voranzutreiben.