Beijing Dark Side of the Moon Technology Co., Ltd. gab kürzlich bekannt, dass sein intelligenter Assistent Kimi ein umfassendes Upgrade erhalten und das multimodale Denkmodell k1.5 eingeführt hat. Dieses Modell übertrifft viele führende internationale Modelle, darunter GPT-4o und Claude3.5Sonnet, in Bezug auf multimodale Argumentations- und allgemeine Argumentationsfunktionen und erreicht erstmals von einem anderen Unternehmen als OpenAI die multimodale Argumentationsleistung der offiziellen Version von o1. Dieser Durchbruch markiert Kimis bedeutenden Fortschritt auf dem Gebiet der künstlichen Intelligenz, und die technologische Innovation und die Teamarbeit dahinter verdienen Aufmerksamkeit. Dieses Upgrade verbessert nicht nur die mathematischen, Code- und visuellen multimodalen Verarbeitungsfähigkeiten von Kimi, sondern verbessert auch die Tiefenschlussfähigkeiten des Modells durch lange Kontexterweiterung und verbesserte Methoden zur Strategieoptimierung erheblich und bietet Benutzern eine starke Unterstützung bei der Lösung komplexer Probleme.
Kürzlich gab Beijing Dark Side of the Moon Technology Co., Ltd. bekannt, dass sein intelligenter Assistent Kimi ein großes technologisches Upgrade erhalten und ein neues multimodales Denkmodell k1.5 eingeführt hat. Dieses Modell hat ein branchenführendes Niveau in den Bereichen multimodales Denken und allgemeines Denken erreicht und stellt für Kimi einen weiteren Durchbruch auf dem Gebiet der künstlichen Intelligenz dar.
Das multimodale Denkmodell k1.5 ist Kimis drittes großes Upgrade seines K-Series-Modells für verstärktes Lernen in nur drei Monaten. Nach dem im November letzten Jahres veröffentlichten mathematischen Modell k0-math und dem im Dezember veröffentlichten Modell k1 für visuelles Denken schnitt das Modell k1.5 in Benchmark-Tests hervorragend ab. Im Kurz-CoT-Modus haben die Mathematik-, Codierungs-, visuellen multimodalen und allgemeinen Fähigkeiten von k1.5 die Niveaus der globalen kurzdenkenden SOTA-Modelle GPT-4o und Claude3.5Sonnet mit einem Vorsprung von bis zu 550 % deutlich übertroffen. Im Long-CoT-Modus haben die Mathematik-, Code- und multimodalen Argumentationsfunktionen von k1.5 auch das Niveau der offiziellen Version des Longthink SOTA-Modells OpenAI o1 erreicht. Dies ist das erste Mal auf der Welt, dass ein anderes Unternehmen als OpenAI dies erreicht hat die offizielle Version von o1. Version der multimodalen Argumentationsleistung.
Hinter diesem Upgrade stehen die unermüdlichen Bemühungen und Innovationen des technischen Teams von Kimi. Zum ersten Mal veröffentlichte das Team einen detaillierten Bericht zur Modelltrainingstechnologie „Kimi k1.5: Skalierung zur Erzielung von Verstärkungslernen mithilfe großer Sprachmodelle“, in dem die Erforschung des Modelltrainings unter dem neuen Technologieparadigma aufgezeichnet wird.
Der Bericht wies darauf hin, dass zu den wichtigsten Neuerungen des k1.5-Modells die lange Kontexterweiterung gehört, die die Trainingseffizienz durch teilweise Erweiterungstechnologie verbessert. Es wird auch beobachtet, dass die Erhöhung der Kontextlänge die Modellleistung weiter verbessern kann. Darüber hinaus unterstützen verbesserte Methoden zur Strategieoptimierung und ein prägnantes Framework-Design die starke Leistung des Modells. Es ist erwähnenswert, dass das k1.5-Modell gemeinsam auf Text- und visuellen Daten trainiert wurde und über die Fähigkeit verfügt, gemeinsam zwischen den beiden Modalitäten zu argumentieren. Es schneidet besonders gut in mathematischen Fähigkeiten ab, obwohl es schwierig ist, mit geometrischen Grafikproblemen umzugehen teilweise auf grafisches Verständnis angewiesen Es gibt immer noch Herausforderungen.
Um die Fähigkeit zum Kurzkettendenken weiter zu verbessern, schlug das Team außerdem eine effektive Long2Short-Methode vor, bei der die Long-CoT-Technologie zur Verbesserung des Short-CoT-Modells verwendet wurde, und erzielte in Tests wie AIME, MATH500 und LiveCodeBench deutlich bemerkenswerte Ergebnisse übertrifft bestehende Kurzketten-Denkmodelle wie GPT-4 und Claude Sonnet3.5.
Die Vorschauversion des multimodalen Denkmodells k1.5 wird in Graustufen auf der Website Kimi.com und der neuesten Version der Kimi Smart Assistant-App veröffentlicht. Wenn Benutzer während des Gebrauchs die Schaltfläche zum Wechseln des Modells finden, können sie dieses neu verbesserte Modell erleben. Das k1.5-Modell eignet sich gut für tiefes Denken und kann Benutzern bei der Lösung komplexer Codeprobleme, mathematischer Probleme und Arbeitsprobleme helfen.
Dark Side of the Moon Technology Co., Ltd. gab bekannt, dass es die Aktualisierung der Reinforcement-Learning-Modelle der K-Serie entlang der etablierten Roadmap im Jahr 2025 weiter beschleunigen wird, um mehr Modalitäten, Fähigkeiten in mehr Bereichen und stärkere allgemeine Fähigkeiten bereitzustellen und mehr freizusetzen für Benutzer Möglichkeit.
Link zum Github-Bericht: https://github.com/MoonshotAI/kimi-k1.5
Das Upgrade des Kimi k1.5-Modells demonstriert die kontinuierliche Innovationsfähigkeit von Dark Side of the Moon Technology im Bereich der künstlichen Intelligenz. Auf sein führendes Technologieniveau und seine zukünftigen Entwicklungspläne kann man sich freuen. Ich glaube, dass Kimi den Benutzern in Zukunft ein leistungsfähigeres intelligentes Erlebnis bieten wird.