DeepSeek meluncurkan model inferensi pertamanya R1-Lite-Preview, dengan kinerja melampaui OpenAI o1

Penulis：Eve Cole Waktu Pembaruan：2025-01-28 00:00:02

Editor Downcodes mengetahui bahwa DeepSeek, anak perusahaan raksasa ekuitas swasta Tiongkok Magic Square Quantitative, baru-baru ini merilis model bahasa skala besar terbaru yang berfokus pada inferensi R1-Lite-Preview. Model ini saat ini hanya terbuka untuk umum melalui platform chatbot web DeepSeek Chat, dan kinerjanya telah menarik perhatian luas, bahkan mendekati atau melampaui model pratinjau o1 yang baru-baru ini dirilis oleh OpenAI. DeepSeek dikenal atas kontribusinya terhadap ekosistem AI open source, dan peluncuran ini melanjutkan komitmennya terhadap aksesibilitas dan transparansi.

DeepSeek, anak perusahaan raksasa ekuitas swasta Tiongkok Huifang Quantitative, baru-baru ini merilis model bahasa skala besar terbaru yang berfokus pada inferensi, R1-Lite-Preview. Model tersebut saat ini hanya tersedia untuk umum melalui DeepSeek Chat, platform chatbot web.

DeepSeek dikenal karena kontribusi inovatifnya terhadap ekosistem AI open source, dan rilis baru ini bertujuan untuk menghadirkan kemampuan inferensi tingkat tinggi kepada publik sambil mempertahankan komitmen terhadap aksesibilitas dan transparansi. Meskipun R1-Lite-Preview saat ini hanya tersedia di aplikasi obrolan, R1-Lite-Preview telah menarik perhatian luas dengan kinerja yang mendekati atau bahkan melebihi model o1-preview OpenAI yang baru-baru ini dirilis.

R1-Lite-Preview menggunakan penalaran "pemikiran berantai", yang dapat menunjukkan berbagai proses berpikir yang dilalui saat merespons pertanyaan pengguna.

Meskipun beberapa rantai pemikiran mungkin tampak tidak masuk akal atau salah bagi manusia, secara keseluruhan, jawaban R1-Lite-Preview sangat akurat dan bahkan dapat memecahkan "jebakan" yang dihadapi oleh beberapa model AI tradisional yang kuat seperti seri GPT-4o dan Claude. misalnya berapa huruf R pada kata “strawberry”? “Mana yang lebih besar, 9.11 atau 9.9?”

Menurut DeepSeek, model ini unggul dalam tugas-tugas yang memerlukan penalaran logis, pemikiran matematis, dan pemecahan masalah waktu nyata. Performanya melebihi level pratinjau OpenAI o1 dalam tolok ukur yang ditetapkan seperti AIME (American Invitational Mathematics Examination) dan MATH.

Selain itu, DeepSeek merilis data tambahan pada model tersebut, yang menunjukkan peningkatan akurasi yang stabil ketika model diberi lebih banyak waktu, atau "think token", untuk memecahkan masalah. Bagan tersebut menyoroti bahwa seiring dengan meningkatnya kedalaman berpikir, skor model pada tolok ukur seperti AIME juga meningkat.

Rilis R1-Lite-Preview saat ini berkinerja baik dalam tolok ukur utama, mampu menangani berbagai tugas mulai dari matematika kompleks hingga skenario logika, dengan skor yang sebanding dengan model inferensi teratas seperti GPQA dan Codeforces. Proses penalaran model yang transparan memungkinkan pengguna untuk mengamati langkah-langkah logisnya secara real-time, sehingga meningkatkan rasa tanggung jawab dan kredibilitas sistem.

Perlu dicatat bahwa DeepSeek belum merilis kode lengkap untuk analisis atau pembandingan independen pihak ketiga, juga belum menyediakan antarmuka API untuk pengujian independen. Perusahaan belum menerbitkan postingan blog atau dokumen teknis relevan yang menjelaskan pelatihan atau pengujian R1-Lite-Preview.struktur, yang membuat asal usulnya masih penuh keraguan.

R1-Lite-Preview saat ini tersedia secara gratis melalui DeepSeek Chat (chat.deepseek.com), namun mode “pemikiran mendalam” lanjutannya dibatasi hingga 50 pesan per hari, memungkinkan pengguna untuk merasakan kemampuannya yang kuat. DeepSeek berencana merilis versi open source dari model seri R1 dan API terkait untuk lebih mendukung pengembangan komunitas AI open source.

DeepSeek terus mendorong inovasi di bidang AI open source, dan peluncuran R1-Lite-Preview menambahkan dimensi baru pada inferensi dan skalabilitasnya. Saat dunia usaha dan peneliti mengeksplorasi aplikasi AI yang intensif inferensi, komitmen DeepSeek terhadap keterbukaan akan memastikan bahwa modelnya menjadi sumber daya penting untuk pengembangan dan inovasi.

Pintu masuk resmi: https://www.deepseek.com/

Secara keseluruhan, R1-Lite-Preview menunjukkan kekuatan DeepSeek di bidang model bahasa berskala besar, dan rencana sumber terbukanya juga patut dinantikan. Namun, kurangnya pengungkapan kode dan dokumen teknis juga memberikan lapisan misteri pada rincian teknisnya. Editor Downcodes akan terus memperhatikan perkembangan DeepSeek selanjutnya.

​DeepSeek meluncurkan model inferensi pertamanya R1-Lite-Preview, dengan kinerja melampaui OpenAI o1

DeepSeek meluncurkan model inferensi pertamanya R1-Lite-Preview, dengan kinerja melampaui OpenAI o1