Model inferensi Marco-o1 yang baru-baru ini dirilis oleh Tim AI Internasional Alibaba menunjukkan potensi signifikan dalam memecahkan masalah terbuka. Ini mendobrak keterbatasan model tradisional yang terbatas pada bidang jawaban standar, dan berkomitmen untuk mengeksplorasi penerapan di bidang yang sulit diukur dan tidak memiliki imbalan yang jelas. Fitur inti dari model ini terletak pada metode pelatihannya yang unik dan strategi perluasan ruang solusi, yang memungkinkannya menangani tugas-tugas sulit yang lebih kompleks dan lebih lama, seperti terjemahan kalimat yang panjang dan sulit, dan menunjukkan kemampuan penalaran yang kuat untuk membongkar masalah secara bertahap, dan akhirnya Berikan jawaban yang akurat. Sumber terbuka Marco-o1 juga menyediakan sumber daya berharga bagi komunitas riset AI.
Tim AI Internasional Alibaba baru-baru ini merilis model penalaran baru yang disebut Marco-o1, yang memberikan perhatian khusus pada solusi masalah terbuka dan tidak terbatas pada mata pelajaran dengan jawaban standar, seperti pemrograman dan matematika. Tim peneliti berkomitmen untuk mengeksplorasi apakah model-model tersebut dapat digeneralisasikan secara efektif ke bidang-bidang yang sulit diukur dan tidak memiliki manfaat yang jelas.
Karakteristik model Marco-o1 mencakup penggunaan data CoT yang sangat panjang untuk penyesuaian, penggunaan MCTS untuk memperluas ruang solusi, dan perluasan ruang solusi yang terperinci. Model ini menggunakan self-play+MCTS untuk menyusun kumpulan data CoT yang sangat panjang dengan kemampuan untuk merefleksikan dan mengoreksi, serta dilatih bersama dengan data sumber terbuka lainnya. Selain itu, tim peneliti juga mendefinisikan mini-Step untuk memperluas ruang solusi model dan memandu model untuk menghasilkan jawaban yang lebih baik.
Dalam tugas penerjemahan, model Marco-o1 menunjukkan kemampuannya dalam menangani terjemahan kalimat yang panjang dan sulit. Ini adalah pertama kalinya perpanjangan waktu inferensi diterapkan pada tugas terjemahan mesin. Tim peneliti telah melakukan open source terhadap beberapa data CoT dan model terbaik saat ini, dan berencana untuk melakukan open source lebih banyak data dan model di masa mendatang.
Model akan memikirkan respon secara mendalam ketika melakukan penalaran. Misalnya, ketika mengeluarkan angka 'r pada kata 'strawberry', model akan secara bertahap membongkar setiap huruf dalam kata tersebut dan membandingkannya, dan akhirnya mengeluarkan hasilnya dengan benar. Di bidang terjemahan mesin, model ini dengan tepat mengidentifikasi titik-titik sulit melalui tautan inferensi dan menerjemahkannya kata demi kata, sehingga meningkatkan akurasi terjemahan secara keseluruhan.
Tim peneliti juga telah mencobanya di bidang lain, membuktikan kemampuan model untuk memecahkan masalah umum dunia nyata lainnya. Struktur keseluruhan Marco-o1 menggunakan self-play+MCTS untuk membangun kumpulan data CoT yang sangat panjang dengan kemampuan untuk merefleksikan dan mengoreksi, serta melatihnya bersama dengan data sumber terbuka lainnya. Tim peneliti juga memasukkan beberapa kumpulan data kepatuhan instruksi dari keluarga MarcoPolo untuk meningkatkan kemampuan kepatuhan instruksi model.
Dalam hal penggunaan, tim peneliti menyediakan kode inferensi dan kode penyesuaian. Pengguna dapat dengan mudah memuat model dan tokenizer dan mulai mengobrol atau menyempurnakan model. Selain itu, model juga dapat dijalankan langsung pada versi GGUF di ModelScope, sehingga memberikan cara yang lebih cepat untuk merasakannya.
Peluncuran model Marco-o1 menandai langkah penting yang diambil oleh tim AI internasional Alibaba di bidang model inferensi, memberikan ide dan alat baru untuk memecahkan masalah terbuka.
Lingkup Model:
https://modelscope.cn/models/AIDC-AI/Marco-o1
Arxiv:
https://arxiv.org/abs/2411.14405
Github:
https://github.com/AIDC-AI/Marco-o1
Memeluk Wajah:
https://huggingface.co/AIDC-AI/Marco-o1
Secara keseluruhan, model open source Marco-o1 membawa kemungkinan-kemungkinan baru pada penelitian dan penerapan AI, dan terobosan-terobosannya dalam memecahkan masalah-masalah terbuka patut dinantikan. Tautan terkait memudahkan pengguna untuk lebih memahami dan menggunakan model.