Baru-baru ini, Mistral, model skala besar dalam negeri yang dirilis oleh Universitas Tsinghua, telah menimbulkan tanggapan antusias di GitHub. Ukurannya yang 2B memiliki kinerja yang melampaui banyak model "skala besar", yang sungguh menakjubkan. Hal ini tidak hanya tercermin dalam kinerjanya yang kuat, tetapi juga keunggulan biayanya yang sangat rendah: biaya inferensi 1.700.000 token dapat diperoleh hanya dengan 1 yuan, yang jauh lebih rendah dibandingkan produk serupa. Selain itu, Mistral juga memiliki kemampuan multimodal, yang menunjukkan potensi penerapan yang kuat. Kejadian ini sekali lagi membuktikan bahwa di bidang AI, desain model yang unggul dan pengendalian biaya sama pentingnya, dan ini bukan sekadar "volume adalah raja".
Artikel ini berfokus pada:
Baru-baru ini, Departemen Universitas Tsinghua merilis Mistral yang diproduksi di dalam negeri Model besar ini, yang hanya berukuran 2B, secara tak terduga mendapat sambutan hangat di GitHub dan memperoleh 300+ bintang dalam satu hari. Dalam hal performa, produk ini cukup kompetitif. Terdapat perbedaan besar antara performa dan ukuran. Produk ini telah melampaui banyak model besar "bervolume besar" dalam banyak pencapaian. Aspek biayanya bahkan lebih menakjubkan, hanya membutuhkan 1 yuan untuk mendapatkan 1.700.000 token dengan biaya inferensi. Selain fitur-fitur di atas, produk ini juga memiliki kemampuan multimodal dan menunjukkan hasil yang sangat baik.
Keberhasilan Mistral menunjukkan terobosan dalam kinerja dan biaya model besar dalam negeri, serta memberikan ide-ide baru untuk arah pengembangan model besar di masa depan. Saya percaya bahwa di masa depan, kita akan melihat lebih banyak kejutan serupa yang muncul, sehingga mendorong kemajuan berkelanjutan dari teknologi AI.