DeepSeek meluncurkan model inferensi pertamanya R1-Lite-Preview, yang kinerjanya melampaui OpenAI o1 - artikel AI

Penulis：Eve Cole Waktu Pembaruan：2025-01-26 02:00:01

DeepSeek, anak perusahaan raksasa investasi kuantitatif Tiongkok Huifang Quantitative, baru-baru ini merilis model bahasa skala besar terbaru yang berfokus pada inferensi R1-Lite-Preview. Model ini saat ini hanya tersedia untuk umum melalui platform chatbot web DeepSeek Chat. R1-Lite-Preview menggunakan penalaran "pemikiran berantai", yang dapat menunjukkan proses berpikir yang dilalui saat menjawab pertanyaan pengguna. Meskipun beberapa rantai pemikiran tampak tidak masuk akal, akurasi jawaban secara keseluruhan sangat tinggi, dan bahkan dapat memecahkan beberapa masalah tradisional . Masalah yang sulit ditangani oleh model AI yang kuat. Model ini melampaui model pratinjau o1 OpenAI yang baru-baru ini dirilis dalam beberapa pengujian benchmark, dan kinerjanya sangat baik dalam tugas-tugas yang memerlukan penalaran logis, pemikiran matematis, dan pemecahan masalah secara real-time.

DeepSeek dikenal karena kontribusi inovatifnya terhadap ekosistem AI open source, dan rilis baru ini bertujuan untuk menghadirkan kemampuan inferensi tingkat tinggi kepada publik sambil mempertahankan komitmen terhadap aksesibilitas dan transparansi. Meskipun R1-Lite-Preview saat ini hanya tersedia di aplikasi chat, R1-Lite-Preview telah menarik banyak perhatian dengan kinerja yang mendekati atau bahkan melebihi model o1-preview OpenAI yang baru-baru ini dirilis. R1-Lite-Preview menggunakan penalaran "pemikiran berantai", yang dapat menunjukkan berbagai proses berpikir yang dilalui saat merespons pertanyaan pengguna.

Meskipun beberapa rantai pemikiran mungkin tampak tidak masuk akal atau salah bagi manusia, secara keseluruhan, jawaban R1-Lite-Preview sangat akurat dan bahkan dapat memecahkan "jebakan" yang dihadapi oleh beberapa model AI tradisional yang kuat seperti seri GPT-4o dan Claude. seperti berapa huruf R pada kata "strawberry"? "Mana yang lebih besar, 9.11 atau 9.9?"

Menurut DeepSeek, model ini unggul dalam tugas-tugas yang memerlukan penalaran logis, pemikiran matematis, dan pemecahan masalah waktu nyata. Performanya melampaui level pratinjau OpenAI o1 pada tolok ukur yang ditetapkan seperti AIME (American Invitational Mathematics Examination) dan MATH.

Selain itu, DeepSeek merilis data tambahan untuk model tersebut, yang menunjukkan peningkatan akurasi yang stabil ketika model diberikan lebih banyak waktu, atau "think token", untuk memecahkan masalah. Bagan tersebut menyoroti bahwa seiring dengan meningkatnya kedalaman pemikiran, skor model pada tolok ukur seperti AIME juga meningkat.

Rilis R1-Lite-Preview saat ini berkinerja baik dalam tolok ukur utama, mampu menangani berbagai tugas mulai dari matematika kompleks hingga skenario logika, dengan skor yang sebanding dengan model inferensi teratas seperti GPQA dan Codeforces. Proses penalaran model yang transparan memungkinkan pengguna untuk mengamati langkah-langkah logisnya secara real-time, sehingga meningkatkan rasa tanggung jawab dan kredibilitas sistem.

Perlu dicatat bahwa DeepSeek belum merilis kode lengkap untuk analisis atau pembandingan independen pihak ketiga, juga belum menyediakan antarmuka API untuk pengujian independen. Perusahaan belum merilis postingan blog atau dokumen teknis yang relevan yang menjelaskan pelatihan atau pengujian R1 -Lite-Preview struktur, yang membuat asal usulnya masih penuh keraguan.

R1-Lite-Preview saat ini tersedia secara gratis melalui DeepSeek Chat (chat.deepseek.com), tetapi mode "dalam" lanjutannya dibatasi hingga 50 pesan per hari, memungkinkan pengguna untuk merasakan kemampuannya yang kuat. DeepSeek berencana merilis versi open source dari model seri R1 dan API terkait untuk lebih mendukung pengembangan komunitas AI open source.

DeepSeek terus mendorong inovasi di bidang AI open source, dan peluncuran R1-Lite-Preview menambahkan dimensi baru pada inferensi dan skalabilitasnya. Saat dunia usaha dan peneliti mengeksplorasi aplikasi AI yang intensif inferensi, komitmen DeepSeek terhadap keterbukaan akan memastikan bahwa modelnya menjadi sumber daya penting untuk pengembangan dan inovasi.

Pintu masuk resmi: https://www.deepseek.com/

Menyorot:

DeepSeek merilis model R1-Lite-Preview, yang kinerjanya mendekati dan melampaui OpenAI o1.

Model ini menampilkan proses penalaran yang transparan, dan pengguna dapat mengamati langkah-langkah logis secara real time.

Ia memiliki kemampuan pembelajaran mendalam dan penalaran logis yang luar biasa, dan versi sumber terbuka serta API akan dirilis di masa mendatang.

Secara keseluruhan, model R1-Lite-Preview yang dirilis oleh DeepSeek menunjukkan keunggulan signifikan dalam kemampuan inferensi, dan proses inferensi yang transparan serta rencana open source di masa depan juga patut dinantikan. Namun, kurangnya kode publik dan dokumentasi teknis saat ini membatasi evaluasi komprehensif terhadap kinerjanya.

​DeepSeek meluncurkan model inferensi pertamanya R1-Lite-Preview, yang kinerjanya melampaui OpenAI o1 - artikel AI

DeepSeek meluncurkan model inferensi pertamanya R1-Lite-Preview, yang kinerjanya melampaui OpenAI o1 - artikel AI