Dark Side of the Moon Company hari ini merilis model pemikiran visual baru k1, yang didasarkan pada teknologi pembelajaran penguatan dan telah membuat terobosan signifikan dalam pemahaman dan penalaran gambar. Model k1 tidak hanya mendukung pemahaman gambar menyeluruh, namun juga mengintegrasikan teknologi rantai pemikiran, memperluas cakupan penerapannya ke bidang sains dasar seperti fisika dan kimia, dan melampaui model terkemuka dunia dalam berbagai pengujian benchmark. Inovasinya terletak pada integrasi pemahaman gambar dan kemampuan berpikir. Pengguna dapat langsung memasukkan informasi gambar dan memperoleh jawaban tanpa menggunakan alat eksternal, yang sangat meningkatkan efisiensi interaksi dan pengalaman pengguna.
Dark Side of the Moon hari ini mengumumkan peluncuran model pemikiran visual baru k1. Model ini didasarkan pada teknologi pembelajaran penguatan, yang tidak hanya mendukung pemahaman gambar ujung ke ujung, tetapi juga mengintegrasikan teknologi rantai berpikir, memperluas kemampuannya ke bidang sains yang lebih mendasar selain matematika, termasuk fisika dan kimia. Dalam uji kemampuan benchmark, model k1 mengungguli model benchmark terkemuka di dunia, seperti o1 OpenAI, GPT-4o, dan Claude3.5Sonnet.
Model generasi baru merangsang pembuatan langkah-langkah penalaran yang lebih rinci untuk membentuk rantai pemikiran berkualitas tinggi, yang secara signifikan meningkatkan tingkat keberhasilan penyelesaian tugas-tugas kompleks. Integrasi model k1 Kimi dalam pemahaman gambar dan kemampuan berpikir memberikan pengalaman interaktif yang lebih lancar kepada pengguna. Model ini dapat secara langsung memproses masukan informasi gambar oleh pengguna dan memperoleh jawaban tanpa menggunakan OCR eksternal atau model visual tambahan.
Pelatihan model k1 dibagi menjadi dua tahap, pertama diperoleh model dasar melalui pra pelatihan, kemudian dilakukan pasca pelatihan melalui pembelajaran penguatan. Model dasar mencapai skor luar biasa 903 di OCRBench dan berkinerja luar biasa pada benchmark MathVista-testmini, MMMU-val, dan DocVQA. Pelatihan pembelajaran pasca penguatan dioptimalkan dalam hal kualitas data dan efisiensi pembelajaran, sehingga mencapai terobosan baru dalam skala besar.
Kimi juga telah secara mandiri membuat set tes standar, Science Vista, yang mencakup soal-soal bergambar matematika, fisika, dan kimia dengan berbagai tingkat kesulitan, dan akan terbuka untuk seluruh industri. Meskipun model k1 telah menunjukkan beberapa keterbatasan dalam pengujian internal, seperti ruang untuk perbaikan dalam generalisasi di luar distribusi dan tingkat keberhasilan dalam masalah yang kompleks, performanya dalam adegan kebisingan visual lebih baik dibandingkan model lainnya, sehingga menunjukkan kemampuan pengenalan visual yang sangat kuat.
Model pemikiran visual k1 dari asisten cerdas Kimi tidak hanya berkinerja baik di bidang matematika, tetapi juga meluas ke bidang fisika dan kimia, menunjukkan berbagai kemampuan ilmiah dasar. Selain itu, model k1 telah menunjukkan kemampuan umum untuk menjelaskan dan menalar masalah non-matematika, seperti isi dan latar belakang naskah ilmuwan.
Kimi Smart Assistant berharap dapat menjelajahi dunia yang lebih luas bersama pengguna. Model k1 baru telah diluncurkan. Pengguna dapat merasakan fitur baru ini melalui versi terbaru aplikasi seluler Kimi Smart Assistant atau versi web.
Model k1 Kimi telah menunjukkan kinerja yang baik dalam banyak pengujian benchmark, menunjukkan kemampuan berpikir visualnya yang kuat dan prospek penerapan yang luas. Meskipun masih ada beberapa hal yang perlu ditingkatkan, terobosan dalam pengenalan gambar dan jawaban pertanyaan ilmiah tidak diragukan lagi akan membawa dorongan pengembangan baru di bidang kecerdasan buatan. Pengguna dipersilakan untuk merasakan pengalaman interaktif baru yang dibawa oleh model k1!