Beijing Zhipu Huazhang Technology Co., Ltd. hat am 29. August 2024 sein Basismodell und seine Anwendungsdienste der neuen Generation veröffentlicht und auf der KDD2024-Konferenz ausführlich demonstriert. Dieses Update deckt mehrere Modalitäten wie Sprache, Bilder und Videos ab und führt eine neue Anwendung für C-End-Benutzer ein. Dies zeigt, dass Zhipu im Bereich der künstlichen Intelligenz erhebliche Fortschritte gemacht hat und seine technische Stärke und Innovationsfähigkeit weiter verbessert wurden . . Nachfolgend finden Sie eine detaillierte Erläuterung dieses Updates.
Auf der KDD2024-Konferenz veröffentlichte Zhipu eine neue Generation von Basismodellen, darunter das Sprachmodell GLM-4-Plus, das Vincent-Graphmodell CogView-3-Plus, das Bild-/Videoverständnismodell GLM-4V-Plus und das Videogenerierungsmodell CogVideoX. Diese Modelle haben in ihren jeweiligen Bereichen internationale Spitzenniveaus erreicht. Die Leistung des GLM-4-Plus-Modells wurde in Bezug auf Sprachverständnis, Befehlsfolge und Langtextverarbeitung umfassend verbessert und liegt auf dem Niveau von First-Tier-Modellen wie GPT-4o. Das CogView-3-Plus-Modell verwendet die Transformer-Architektur, um die traditionelle UNet-Architektur zu ersetzen, wodurch der Modelleffekt optimiert wird, und seine Leistung kommt First-Line-Modellen wie MJ-V6 und FLUX nahe. Das GLM-4V-Plus-Modell verfügt über hochwertige Bild- und Videoverständnisfunktionen und ist damit die erste inländische allgemeine API für Videoverständnismodelle. Nach der Veröffentlichung der 2B-Version öffnete das CogVideoX-Modell die 5B-Version mit verbesserter Leistung weiter und wurde zum Marktführer unter den aktuellen Open-Source-Videogenerierungsmodellen. Darüber hinaus hat Zhipu Chinas ersten Videoanrufdienst für C-End-Benutzer auf der „Qingyan APP“ eingeführt. Dieser Dienst umfasst Text-, Audio- und Videomodi und verfügt über Echtzeit-Argumentationsfunktionen, die den Benutzern ein reibungsloses interaktives Erlebnis bieten. Zhipu kündigte außerdem die kostenlose Nutzung der GLM-4-Flash-API an, die Vorteile in Bezug auf Geschwindigkeit und Leistung bietet und es Benutzern ermöglicht, schnell und kostenlos exklusive Modelle und Anwendungen zu erstellen. Um den Anforderungen verschiedener Benutzer gerecht zu werden, bietet Zhipu gleichzeitig Funktionen zur Modellfeinabstimmung. Zhipu sagte, es werde weiter voranschreiten, Maschinen dazu bringen, wie Menschen zu denken und den Benutzern fortschrittlichere Technologien und Dienste anzubieten.
Darüber hinaus hat Zhipu Chinas ersten Videoanrufdienst für C-End-Benutzer auf der „Qingyan APP“ eingeführt. Dieser Dienst umfasst Text-, Audio- und Videomodi und verfügt über Echtzeit-Argumentationsfunktionen, die den Benutzern ein reibungsloses interaktives Erlebnis bieten.
Zhipu kündigte außerdem die kostenlose Nutzung der GLM-4-Flash-API an, die Vorteile in Bezug auf Geschwindigkeit und Leistung bietet und es Benutzern ermöglicht, schnell und kostenlos exklusive Modelle und Anwendungen zu erstellen. Um den Anforderungen verschiedener Benutzer gerecht zu werden, bietet Zhipu gleichzeitig Funktionen zur Modellfeinabstimmung.
Zhipu sagte, es werde weiter voranschreiten, Maschinen dazu bringen, wie Menschen zu denken und den Benutzern fortschrittlichere Technologien und Dienste anzubieten.
Wichtige Updates:
Sprachbasismodell GLM-4-Plus: Seine Leistung wurde in Bezug auf Sprachverständnis, Befehlsfolge und Langtextverarbeitung umfassend verbessert und hält damit das international führende Niveau.
Vincent-Diagramm-Basismodell CogView-3-Plus: weist eine Leistung auf, die den derzeit besten Modellen wie MJ-V6 und FLUX nahekommt.
Bild-/Videoverständnis-Basismodell GLM-4V-Plus: Es verfügt über hervorragende Bildverständnisfähigkeiten und verfügt über Videoverständnisfähigkeiten basierend auf der Zeitwahrnehmung. Das Modell wird auf der offenen Plattform (bigmodel.cn) eingeführt und ist die erste allgemeine API für Videoverständnismodelle in China.
Basismodell für die Videogenerierung CogVideoX: Nachdem die 2B-Version veröffentlicht und als Open Source bereitgestellt wurde, wurde auch die 5B-Version offiziell als Open Source bereitgestellt. Ihre Leistung wurde weiter verbessert und sie ist die beste Wahl unter den aktuellen Open-Source-Videogenerierungsmodellen.
„Qingyan APP“ startete Videoanrufe: der erste inländische Videoanrufdienst, der C-End-Benutzern offen steht. Die Videoanruffunktion von „Qingyan APP“ umfasst Text-, Audio- und Videomodi und verfügt über Echtzeit-Argumentationsfähigkeiten.
GLM-4-Flash API: Der Inferenzdienst ist völlig kostenlos und bietet Feinabstimmungsdienste.
Link zur Anwendung des Videoanrufdienstes:
https://zhipu-ai.feishu.cn/share/base/form/shrcnqpIx9q5ILEFeT2cPNhyuSf
Alles in allem demonstriert das technologische Update von Zhipu Huazhang seine starke Stärke und kontinuierliche Innovationsfähigkeit im Bereich der künstlichen Intelligenz, stellt den Benutzern fortschrittlichere Technologien und Dienste zur Verfügung und verleiht der Entwicklung der Branche der künstlichen Intelligenz neue Dynamik.