Peneliti Microsoft telah merilis kerangka kerja AI baru yang disebut Auto Evol-Instruct yang dapat secara otomatis mengembangkan kumpulan data panduan tanpa campur tangan manusia. Hal ini sangat penting untuk meningkatkan kemampuan model bahasa besar (LLM) untuk mengikuti instruksi yang kompleks. Metode evolusi tradisional bergantung pada aturan yang dirancang secara artifisial, yang tidak efisien dan sulit untuk beradaptasi dengan tugas-tugas baru. Auto Evol-Instruct, di sisi lain, secara otomatis menganalisis instruksi melalui LLM, merancang dan mengoptimalkan aturan evolusi secara mandiri, mewujudkan proses evolusi yang otomatis dan efisien, dan sangat meningkatkan kompleksitas dan keragaman kumpulan data.
Baru-baru ini, peneliti Microsoft mengusulkan kerangka kerja AI baru yang disebut Auto Evol-Instruct, yang dapat secara otomatis mengembangkan kumpulan data panduan tanpa campur tangan manusia.
Di bidang kecerdasan buatan, pengembangan model bahasa besar (LLM) sangatlah penting, terutama dalam meningkatkan kemampuan model tersebut dalam mengikuti instruksi rinci. Para peneliti telah mengeksplorasi cara meningkatkan kumpulan data yang digunakan untuk melatih LLM guna meningkatkan kinerja dan kemampuan beradaptasi model.
Metode evolusi tradisional seperti Evol-Instruct mengandalkan aturan evolusi yang ditentukan oleh pakar manusia, yang tidak hanya mahal dan memakan waktu, namun juga memerlukan desain ulang metode saat beradaptasi dengan tugas baru. Sebaliknya, Auto Evol-Instruct mewujudkan proses evolusi otomatis dengan terlebih dahulu menggunakan LLM untuk menganalisis instruksi masukan dan secara mandiri merancang metode awal aturan evolusi. Selanjutnya, metode evolusi dioptimalkan secara berulang melalui LLM pengoptimal untuk mengidentifikasi dan memecahkan masalah selama proses evolusi guna memastikan kompleksitas dan stabilitas instruksi evolusi akhir.
Auto Evol-Instruct menggunakan LLM untuk merancang metode evolusi dengan secara otomatis menganalisis instruksi masukan dan merumuskan aturan evolusi, sehingga meningkatkan kompleksitas dan keragaman kumpulan data.
Dalam hal evaluasi kinerja, Auto Evol-Instruct berkinerja baik dalam berbagai pengujian benchmark. Misalnya, dengan menyempurnakan Mixtral-8x7B hanya menggunakan 10K data ShareGPT yang dikembangkan, kerangka kerja ini mencapai 8,09 poin pada MT-Bench dan 91,4 poin pada AlpacaEval, melampaui GPT-3.5-Turbo dan WizardLM-70B, dan bersaing dengan Claude2.0. setara.
Selain itu, dengan hanya menggunakan data pelatihan GSM8K yang berevolusi 7K, kerangka kerja ini mencapai 82,49 poin pada GSM8K. Dalam hal pembuatan kode, dengan menyempurnakan DeepSeek-Coder-Base-33B menggunakan 20K Code Alpaca yang berevolusi, kerangka kerja tersebut mencapai skor 82,49 pada HumanEval mencapai skor 77,4, melampaui model pesaing lainnya.
Dapat dilihat bahwa kerangka kerja baru ini berkinerja baik dalam beberapa pengujian benchmark, termasuk MT-Bench, AlpacaEval, GSM8K dan HumanEval, yang menunjukkan potensinya dalam meningkatkan kemampuan mengikuti instruksi, penalaran matematis, dan pembuatan kode.
Alamat makalah: https://arxiv.org/abs/2406.00770
Highlight:
Auto Evol-Instruct adalah kerangka kerja AI otomatis yang dapat menganalisis dan mengembangkan kumpulan data panduan secara otomatis tanpa campur tangan manusia.
Kerangka kerja ini secara efektif meningkatkan kompleksitas dan keragaman kumpulan data dengan mengoptimalkan metode evolusi, sehingga meningkatkan kinerja dan kemampuan beradaptasi LLM dalam berbagai tugas.
Hasil Auto Evol-Instruct menunjukkan metode untuk memandu evolusi kumpulan data melalui otomatisasi.
Munculnya kerangka kerja Auto Evol-Instruct menandai inovasi besar dalam metode evolusi data pelatihan LLM. Fitur-fiturnya yang otomatis dan efisien akan sangat mendorong pengembangan LLM dan memberikan dukungan kuat untuk membangun model AI yang lebih kuat dan mudah beradaptasi. Makalah yang relevan telah diterbitkan, dan pembaca yang tertarik dapat mempelajarinya secara mendalam.