Shanghai Step Star Intelligent Technology Co., Ltd. secara resmi meluncurkan model penalaran yang dikembangkan sendiri Step Reasoner mini (Step R-mini) pada 16 Januari 2025. Model ini adalah model inferensi pertama dalam seri Step. Pengguna dapat merasakan kemampuan inferensi yang kuat melalui halaman web Yuewen. Step R-mini berkinerja baik di banyak bidang seperti penalaran logis, pengkodean, matematika, dan penciptaan sastra. Kinerjanya dalam berbagai tes benchmark bahkan melebihi beberapa model pesaing. Keunggulan model ini adalah kemampuannya untuk mempertimbangkan kompetensi seni liberal dan sains, yang jarang terjadi pada model serupa.
Pada 16 Januari 2025, Shanghai Step Reasoner Intelligent Technology Co., Ltd. mengumumkan bahwa model penalaran yang dikembangkan sendiri Step Reasoner mini ("Step R-mini") secara resmi diluncurkan. Pengguna dapat masuk ke halaman web Yuewen https://yuewen.cn dan memilih "Langkah R-mini" di sudut kiri atas untuk merasakannya.
Step R-mini adalah model penalaran pertama dalam rangkaian model seri Step. Model ini bagus dalam perencanaan proaktif, uji coba, dan refleksi, serta memberikan respons yang akurat dan andal kepada pengguna melalui mekanisme logika berpikir lambat dan verifikasi berulang. Ia tidak hanya dapat menyelesaikan masalah-masalah kompleks seperti penalaran logis, pengkodean dan matematika melalui kemampuan penalaran yang sangat panjang, tetapi juga memperhitungkan bidang-bidang umum seperti penciptaan sastra.
Matriks model dasar seri Step yang dikembangkan secara independen oleh Step Star telah mencakup kemampuan komprehensif mulai dari bahasa, multi-modalitas hingga penalaran. Dalam pengujian benchmark matematika seperti AIME dan Math, performa Step R-mini melebihi o1-preview dan sebanding dengan OpenAI o1-mini. Ini juga berkinerja lebih baik daripada pratinjau o1 pada tugas kode LiveCodeBench. Perlu disebutkan bahwa sebagian besar model inferensi tidak dapat memperhitungkan seni dan sains, tetapi Langkah R-mini mencapai "seni dan sains" melalui pelatihan pembelajaran penguatan skala besar dan penggunaan algoritma pembelajaran penguatan Sesuai Kebijakan”, itu tidak hanya dapat menjawab pertanyaan matematika, coding, dan penalaran logis secara akurat, tetapi juga menyelesaikan tugas pembuatan konten sastra dan obrolan harian secara kreatif.
Dalam aplikasi praktis, Step R-mini menunjukkan hasil yang sangat baik. Saat memecahkan masalah matematika, ketika menghadapi masalah Olimpiade Matematika, ia dapat membangun rantai penalaran yang masuk akal, mewujudkan perencanaan dan solusi langkah demi langkah dari masalah matematika yang kompleks, dan menghitung solusi yang berbeda untuk validasi silang. Saat menghadapi permasalahan geometri, Anda dapat aktif membuat media konten untuk berpikir mendalam melalui sketsa. Dalam tugas penalaran logis, cobalah secara mandiri berbagai ide pemecahan masalah dan ajukan pertanyaan pada diri Anda sendiri untuk memastikan bahwa semua solusi yang baik telah disebutkan. Dalam hal pertanyaan pengkodean, Anda dapat menjawab pertanyaan algoritma dengan benar dengan tingkat kesulitan "Sulit" pada platform teknologi LeetCode. Anda juga dapat menangani persyaratan pengembangan yang kompleks, menganalisis kebutuhan dan niat pengguna secara bertahap, dan membangun logika kode. Dalam hal pembuatan konten, Anda dapat memahami secara mendalam kebutuhan ekspresi pengguna, menganalisis tema kreatif, tema sastra, dan persyaratan lainnya, memikirkan sudut pandang kreatif, menggambarkan adegan, teknik retorika, dan struktur konten, memberikan makna simbolis pada tingkat emosional manusia. , dan menambahkan elemen yang dipersonalisasi dan inovatif. Dalam hal penerjemahan, kami mengikuti prinsip "kesetiaan, keanggunan, keanggunan" dan berupaya menyajikan hasil terjemahan yang akurat dan bermakna.
Selain model penalaran bahasa, Step Star juga membangun model penalaran visual untuk mengintegrasikan kemampuan penalaran ke dalam model besar dengan bentuk yang lebih interaktif. Bertujuan pada masalah Penalaran dalam adegan visual yang kompleks, ide-ide persepsi lambat dan penalaran spasial diperkenalkan untuk mentransfer Penskalaan Waktu Tes dari ruang teks ke ruang visual untuk mewujudkan Pemikiran Spasial-Lambat dalam ruang visual. Saat ini, model penalaran visual telah mencapai hasil awal, dan versi resminya diharapkan akan dirilis ke semua orang tahun ini.
Peluncuran Step R-mini menandai terobosan besar bagi Step Star di bidang kecerdasan buatan. Kemampuan penalarannya yang kuat dan potensi penerapan multi-bidang patut dinantikan. Kedepannya kami akan terus memperhatikan pengembangan Step Star lebih lanjut di bidang kecerdasan buatan.