Model besar R1, yang bersumber terbuka oleh tim DeepSeek Tiongkok, telah menunjukkan keunggulan mengesankan dalam hal kinerja dan biaya, sehingga menarik perhatian luas dari komunitas teknologi global. Model ini telah melampaui model o1 OpenAI dalam banyak pengujian resmi, terutama di bidang matematika dan pemrograman. Model ini menonjol karena keunggulan biayanya yang sangat rendah dan telah menjadi kuda hitam di bidang model besar sumber terbuka. R1 yang bersifat open source tidak hanya menunjukkan terobosan Tiongkok di bidang teknologi model besar, namun juga memberikan vitalitas baru ke dalam pengembangan AI global.
Teks: Baru-baru ini, tim DeepSeek Tiongkok meluncurkan model besar open source terbarunya, R1, yang telah menarik perhatian luas. Performa model R1 sangat baik, melampaui model o1 OpenAI dalam banyak pengujian, terutama dalam evaluasi matematika dan pemrograman.
Dalam tes AIME2024 Amerika terbaru, R1 mencetak 79,8 poin, melampaui o1 yang sebesar 79,2 poin. Dalam tes MATH-500, R1 mencetak 97,3 poin, juga unggul dari o1 yang memperoleh 96,4 poin. Selain itu, pada tes Terverifikasi SWE-bench, R1 mendapat skor 49,2, yang juga melampaui skor o1 sebesar 48,9. Meskipun dalam uji kode Codeforces, R1 hanya 0,3 poin lebih rendah dari o1, performa keseluruhannya setara dengan model o1.
Selain performa, keunggulan biaya R1 pun semakin menarik perhatian. Model o1 OpenAI memiliki biaya input hingga US$15 per 1 juta token, sedangkan biaya R1 hanya US$0,14, pengurangan biaya sebesar 90%. Dari segi output, biaya o1 adalah US$60 per 1 juta token, sedangkan R1 hanya berharga US$2,19, berkurang 27 kali lipat. Perbedaan biaya yang besar ini membuat R1 menonjol di bidang model open source besar.
Setelah tim DeepSeek mengumumkan bahwa R1 adalah open source, banyak netizen asing menyatakan kekaguman mereka terhadap model ini, percaya bahwa R1 melampaui platform open source yang sudah mapan seperti Meta dan Mistral dalam hal kinerja biaya dan kinerja. Banyak orang mengatakan bahwa kemampuan penalaran yang efisien dari model R1 menjadikannya sangat baik dalam penulisan kode dan penjelasan matematis. Beberapa pengguna bahkan menyebutnya sebagai "model yang paling menyerupai monolog batin manusia". Pada saat yang sama, peneliti pembelajaran mesin Apple, Awni Hannun, juga menguji R1 dan menemukan bahwa R1 berjalan cepat dan memiliki efisiensi inferensi yang tinggi pada Apple M2Ultra.
Pengembangan model R1 melalui proses pelatihan multi tahap, meliputi data cold start dan pelatihan multi tahap untuk meningkatkan kemampuan inferensi dan keterbacaannya. Peningkatan teknis ini memastikan kinerja superior model R1 dalam berbagai tugas.
Dengan dirilisnya R1, model open source besar Tiongkok sekali lagi menarik perhatian dan diskusi besar di pasar internasional, dan banyak penggemar teknologi telah menyatakan ekspektasi terhadap potensi model ini. Peluncuran R1 menandai terobosan lebih lanjut Tiongkok di bidang teknologi model besar dan mendorong pengembangan teknologi sumber terbuka.
Alamat sumber terbuka: https://huggingface.co/deepseek-ai/R1
API: https://api-docs.deepseek.com/guides/reasoning_model
Menyorot:
Model R1 melampaui o1 OpenAI dalam beberapa pengujian, menunjukkan kinerja yang sangat baik.
Biaya input dan output R1 masing-masing serendah $0,14 dan $2,19, yang berarti pengurangan biaya sebesar 90%.
R1 telah mendapat perhatian luas sejak open source. Banyak pakar asing memuji kinerjanya dan percaya bahwa ini sangat hemat biaya.
Kemunculan R1 tidak hanya memberikan para pengembang alat canggih dengan kinerja tinggi dan biaya rendah, namun juga menandai kelanjutan inovasi dan peningkatan daya saing Tiongkok di bidang kecerdasan buatan. Kami berharap R1 membawa terobosan ke lebih banyak bidang di masa depan.