Startup AI Perancis Les Ministraux telah merilis dua model AI ringan, Ministral3B dan Ministral8B, dengan parameter masing-masing 3 miliar dan 8 miliar, yang dirancang untuk perangkat edge. Kedua model ini memiliki performa yang luar biasa dalam instruksi setelah pengujian benchmark, terutama mengungguli model dengan level yang sama dalam hal pengetahuan, akal sehat, penalaran, dan efisiensi. Mereka bahkan mengungguli model dengan parameter yang lebih besar dalam beberapa aspek, sehingga menetapkan tolok ukur baru untuk level rendah. model parameter. Redaksi Downcodes akan memberikan penjelasan detail mengenai performa, fitur, dan perusahaan di balik kedua model ini.
Startup AI Perancis Les Ministraux telah meluncurkan dua model ringan baru, Ministral3B dan Ministral8B, yang dirancang khusus untuk perangkat edge, dengan parameter masing-masing 3 miliar dan 8 miliar. Kedua model tersebut berkinerja baik dalam benchmark mengikuti instruksi, dengan Ministral3B mengungguli Llama38B dan Mistral7B, sementara Ministral8B mengungguli kedua model ini dalam semua aspek kecuali kemampuan kode.
Hasil pengujian menunjukkan bahwa performa Minitral3B dan Minitral8B sebanding dengan model open source seperti Gemma2 dan Llama3.1. Kedua model mendukung hingga 128 ribu konteks dan menetapkan tolok ukur baru untuk model parameter sub-10B dalam hal pengetahuan, akal sehat, penalaran, pemanggilan fungsi, dan efisiensi. Ministral8B juga dilengkapi dengan mekanisme perhatian jendela geser untuk inferensi dalam memori yang lebih cepat dan efisien. Mereka dapat disesuaikan dengan berbagai kasus penggunaan, seperti mengelola alur kerja agen AI yang kompleks atau membuat asisten tugas khusus.
Para peneliti melakukan beberapa tes benchmark pada model Les Ministraux, yang mencakup aspek-aspek seperti pengetahuan dan akal sehat, coding, matematika dan multibahasa. Pada tahap model pra-pelatihan, Minitral3B mencapai hasil terbaik dibandingkan dengan Gema22B dan Llama3.23B. Dibandingkan dengan Llama3.18B dan Mistral7B, Mistral8B memiliki kinerja terbaik di semua aspek kecuali kemampuan coding. Pada tahap model instruksi setelah penyempurnaan, Minitral3B mencapai hasil terbaik dalam pengujian benchmark yang berbeda, dan Minitral8B hanya sedikit lebih rendah daripada Gema29B di bangku Wild.
Peluncuran model Les Ministraux memberi pengguna solusi latensi rendah dan efisien secara komputasi yang memenuhi kebutuhan semakin banyak pengguna akan inferensi lokal yang mengutamakan aplikasi penting. Pengguna dapat menerapkan model ini pada skenario seperti terjemahan pada perangkat, asisten cerdas yang tidak memerlukan koneksi Internet, dan robot otonom. Harga input dan output Ministral8B adalah US$0,1 per juta token, dan Ministral3B adalah US$0,04 per juta token.
Perlu dicatat bahwa Mistral sebelumnya telah membuka banyak model sumber terbuka melalui tautan magnet dan telah diakui oleh komunitas AI. Namun, perusahaan tersebut telah terlibat dalam kontroversi tahun ini karena tidak lagi seterbuka dulu. Ada kabar bahwa Microsoft akan mengakuisisi sebagian saham Mistral dan berinvestasi di dalamnya, yang berarti model Mistral akan dihosting di Azure AI. Netizen Reddit menemukan bahwa Mistral telah menghapus komitmennya terhadap open source dari situs resminya. Beberapa model perusahaan juga sudah mulai dikenakan biaya, termasuk Ministral3B dan Ministral8B yang dirilis kali ini.
Detailnya: https://mistral.ai/news/ministraux/
Secara keseluruhan, kemunculan Minitral3B dan Minitral8B memberikan pilihan yang kuat untuk aplikasi AI komputasi edge, dan kinerjanya yang efisien serta harga yang murah memberikan keunggulan kompetitif yang signifikan. Namun perubahan strategi Mistral juga memicu pemikiran industri tentang keseimbangan antara model open source dan komersialisasi. Kedepannya kami akan terus memperhatikan penerapan dan pengembangan model Les Ministraux.