IBM kündigte die Einführung seines Open-Source-Großsprachenmodells Granite3.1 der neuen Generation an, mit dem Ziel, im Bereich der KI auf Unternehmensebene führend zu sein. Granite3.1 verfügt über viele Highlights, darunter eine erweiterte Kontextlänge auf 128 KB, effiziente Einbettungsmodelle, integrierte Halluzinationserkennungsfunktionen und eine deutlich verbesserte Gesamtleistung. Laut IBM schneidet sein Granite8B-Instruct-Modell unter den Open-Source-Modellen derselben Größenordnung am besten ab und übertrifft Konkurrenten wie Metas Llama3.1, Qwen2.5 und Googles Gemma2. Die Veröffentlichung dieses neuen Modells folgt auf die Einführung von Granite 3.0 im Oktober und spiegelt die schnelle Iteration und kontinuierliche Investition von IBM im Bereich der generativen KI wider, mit einem damit verbundenen Geschäftsumsatz von 2 Milliarden US-Dollar.
IBM hat offiziell seine neue Generation des Open-Source-Großsprachenmodells Granite3.1 veröffentlicht und strebt danach, eine führende Position im Bereich der KI auf Unternehmensebene einzunehmen. Diese Modellserie verfügt über eine um 128 KB erweiterte Kontextlänge, eingebettete Modelle, integrierte Halluzinationserkennungsfunktionen und erhebliche Leistungsverbesserungen.
IBM behauptet, dass das Granite8B Instruct-Modell unter Open-Source-Konkurrenten gleicher Größe am besten abschneidet, darunter Metas Llama3.1, Qwen2.5 und Googles Gemma2.
Die Veröffentlichung des Granite3.1-Modells erfolgt vor dem Hintergrund der schnellen Iteration der Granite3.0-Serie durch IBM, die bereits im Oktober auf den Markt kam. IBM gab bekannt, dass sein Geschäftsumsatz im Zusammenhang mit der Generierung von KI 2 Milliarden US-Dollar erreicht hat. Der Kerngedanke der neuen Version besteht darin, mehr Funktionalität in ein kleineres Modell zu integrieren, um es für Geschäftsanwender einfacher und kostengünstiger betreiben zu können.
David Cox, Vizepräsident von IBM Research, sagte, dass das Granite-Modell in IBMs internen Produkten, Beratungsdiensten und Kundendiensten weit verbreitet ist und auch in Open-Source-Form veröffentlicht wird, sodass es in allen Aspekten ein hohes Niveau erreichen muss. Bei der Bewertung der Modellleistung kommt es nicht nur auf die Geschwindigkeit, sondern auch auf die Effizienz an, sodass Benutzer bei der Erzielung von Ergebnissen Zeit sparen können.
In Bezug auf die Kontextlänge ist die Verbesserung von Granite3.1 besonders offensichtlich und erstreckt sich von der ersten Version von 4K auf 128K, was besonders für Benutzer von Unternehmens-KI wichtig ist, insbesondere im Hinblick auf Retrieval Enhanced Generation (RAG) und intelligente Agenten-KI. Durch die erweiterte Kontextlänge kann das Modell längere Dokumente, Protokolle und Konversationen verarbeiten und so komplexe Abfragen besser verstehen und darauf reagieren.
IBM hat außerdem eine Reihe von Einbettungsmodellen auf den Markt gebracht, um die Umwandlung von Daten in Vektoren zu beschleunigen. Unter anderem beträgt die Abfragezeit des Granite-Embedding-30M-English-Modells 0,16 Sekunden und ist damit schneller als bei Konkurrenzprodukten. Um die Leistungsverbesserung von Granite3.1 zu erreichen, hat IBM den mehrstufigen Trainingsprozess und die Verwendung hochwertiger Trainingsdaten innoviert.
Im Hinblick auf die Halluzinationserkennung integriert das Granite3.1-Modell einen Halluzinationsschutz in das Modell, der falsche Ausgaben selbst erkennen und reduzieren kann. Diese integrierte Erkennung optimiert die Gesamteffizienz und reduziert die Anzahl der Inferenzaufrufe.
Derzeit steht das Granite3.1-Modell Unternehmensbenutzern kostenlos zur Verfügung und wird über den Watsonx Enterprise AI-Dienst von IBM bereitgestellt. IBM plant, auch in Zukunft ein schnelles Aktualisierungstempo beizubehalten, und Granite 3.2 wird Anfang 2025 multimodale Funktionen einführen.
Offizieller Blog: https://www.ibm.com/new/announcements/ibm-granite-3-1-powerful-performance-long-context-and-more
Highlight:
IBM hat das Granite3.1-Modell auf den Markt gebracht, mit dem Ziel, eine führende Position auf dem Open-Source-Markt für große Sprachmodelle einzunehmen.
Das neue Modell unterstützt eine Kontextlänge von 128 KB und verbessert so die Verarbeitungsfähigkeiten und -effizienz erheblich.
In das Modell sind Funktionen zur Illusionserkennung integriert, die die Gesamtleistung und -genauigkeit optimieren.
Alles in allem stellt die Veröffentlichung von Granite3.1 einen weiteren großen Fortschritt für IBM im Bereich der Open-Source-Großsprachenmodelle dar. Seine leistungsstarke Leistung und die umfangreichen Funktionen werden Unternehmensbenutzern ein komfortableres und effizienteres KI-Erlebnis bieten. Es lohnt sich, auf zukünftige Iterationen gespannt zu sein.