Dark Side of the Moon Company hat heute ein neues visuelles Denkmodell k1 veröffentlicht, das auf Reinforcement-Learning-Technologie basiert und bedeutende Durchbrüche im Bildverständnis und Argumentation erzielt hat. Das k1-Modell unterstützt nicht nur ein durchgängiges Bildverständnis, sondern integriert auch die Denkkettentechnologie, erweitert seinen Anwendungsbereich auf grundlegende Wissenschaftsbereiche wie Physik und Chemie und übertrifft die weltweit führenden Modelle in mehreren Benchmark-Tests. Seine Innovation liegt in der Integration von Bildverständnis und Denkfähigkeit. Benutzer können Bildinformationen direkt eingeben und Antworten erhalten, ohne auf externe Tools zurückgreifen zu müssen, was die Interaktionseffizienz und das Benutzererlebnis erheblich verbessert.
Dark Side of the Moon gab heute die Veröffentlichung eines neuen visuellen Denkmodells k1 bekannt. Dieses Modell basiert auf der Reinforcement-Learning-Technologie, die nicht nur ein durchgängiges Bildverständnis unterstützt, sondern auch die Denkkettentechnologie integriert und ihre Fähigkeiten auf grundlegendere Wissenschaftsbereiche neben der Mathematik, einschließlich Physik und Chemie, ausdehnt. Im Benchmark-Fähigkeitstest übertraf das k1-Modell die weltweit führenden Benchmark-Modelle wie o1, GPT-4o und Claude3.5Sonnet von OpenAI.
Das Modell der neuen Generation stimuliert die Generierung detaillierterer Argumentationsschritte, um eine hochwertige Denkkette zu bilden, wodurch die Erfolgsquote bei der Lösung komplexer Aufgaben erheblich verbessert wird. Die Integration des k1-Modells von Kimi in die Bildverständnis- und Denkfähigkeiten bietet Benutzern ein reibungsloseres interaktives Erlebnis. Es kann die vom Benutzer eingegebenen Bildinformationen direkt verarbeiten und Antworten erhalten, ohne auf externe OCR oder zusätzliche visuelle Modelle zurückgreifen zu müssen.
Das Training des k1-Modells ist in zwei Phasen unterteilt. Zuerst wird das Grundmodell durch Vortraining erhalten und dann wird auf dieser Basis ein Nachtraining durch Verstärkungslernen durchgeführt. Das Basismodell erreichte auf OCRBench eine hervorragende Punktzahl von 903 und schnitt bei den Benchmarks MathVista-testmini, MMMU-val und DocVQA hervorragend ab. Das Lerntraining nach der Verstärkung wird im Hinblick auf Datenqualität und Lerneffizienz optimiert und erzielt neue Durchbrüche in der Größenordnung.
Kimi hat außerdem unabhängig einen standardisierten Testsatz, Science Vista, erstellt, der mathematische, physikalische und chemische Bildfragen unterschiedlicher Schwierigkeitsgrade abdeckt und der gesamten Branche offen stehen wird. Obwohl das k1-Modell in internen Tests einige Einschränkungen gezeigt hat, wie z. B. Verbesserungspotenzial bei der Verallgemeinerung außerhalb der Verteilung und Erfolgsquote bei komplexen Problemen, ist seine Leistung in visuellen Rauschszenen besser als bei anderen Modellen und zeigt eine sehr starke visuelle Erkennungsfähigkeit.
Das visuelle Denkmodell k1 des intelligenten Assistenten Kimi schneidet nicht nur im Bereich der Mathematik gut ab, sondern erstreckt sich auch auf die Bereiche Physik und Chemie und demonstriert ein breites Spektrum grundlegender wissenschaftlicher Fähigkeiten. Darüber hinaus hat das k1-Modell eine allgemeine Fähigkeit bewiesen, nichtmathematische Probleme zu erklären und zu begründen, beispielsweise den Inhalt und die Hintergrundgeschichte des Manuskripts eines Wissenschaftlers.
Kimi Smart Assistant freut sich darauf, mit Benutzern eine größere Welt zu erkunden. Das neue k1-Modell wurde eingeführt. Benutzer können diese neue Funktion über die neueste Version der mobilen App oder Webversion von Kimi Smart Assistant erleben.
Das k1-Modell von Kimi hat in vielen Benchmark-Tests gut abgeschnitten und seine starke visuelle Denkfähigkeit und seine breiten Anwendungsaussichten unter Beweis gestellt. Obwohl es noch einige Verbesserungsmöglichkeiten gibt, werden die Durchbrüche in der Bilderkennung und der Beantwortung wissenschaftlicher Fragen zweifellos neue Entwicklungsimpulse für den Bereich der künstlichen Intelligenz bringen. Benutzer sind herzlich eingeladen, das neue interaktive Erlebnis des k1-Modells zu erleben!