Laporan editor Downcode: MiniCPM-V2.6, model sisi akhir multi-modal parameter 8B dari OpenBMB, baru-baru ini mencapai hasil yang mengesankan di GitHub dan Hugging Face, berada di peringkat 3 Teratas, dan jumlah bintang GitHub telah melampaui 10.000. dan jumlah unduhan melebihi satu juta! Ini secara komprehensif melampaui GPT-4V dalam hal pemahaman gambar tunggal, multi-gambar, dan video, dan untuk pertama kalinya mengintegrasikan fungsi-fungsi canggih seperti pemahaman video real-time dan pemahaman gabungan multi-gambar. Performanya yang efisien dan metode penerapan yang mudah digunakan menjadikannya ukuran penting mengenai batas kemampuan model sisi akhir, yang telah menarik perhatian luas di kalangan teknologi global.
Sejak dirilis, versi terbaru 2.6 dari seri MiniCPM-V dengan cepat naik ke Top 3 dalam daftar tren GitHub dan HuggingFace, komunitas sumber terbuka terkemuka di dunia, dan jumlah bintang GitHub-nya telah melampaui 10.000. Sejak debutnya pada tanggal 1 Februari, seri MiniCPM telah diunduh lebih dari satu juta kali, menjadi ukuran penting dari batas kemampuan model sisi klien.
MiniCPM-V2.6 mencapai peningkatan kinerja komprehensif dalam pemahaman gambar tunggal, multi-gambar, dan video dengan parameter 8B, melampaui GPT-4V. Model multi-modal sisi akhir ini mengintegrasikan fungsi-fungsi canggih seperti pemahaman video waktu nyata, pemahaman gabungan multi-gambar, dan ICL multi-gambar untuk pertama kalinya. Ini hanya menempati memori 6GB di sisi back-end terkuantisasi, dan kecepatan inferensi sisi akhir mencapai 18 token/s, yang 33% lebih cepat dari model generasi sebelumnya inferensi, dan mendukung berbagai bahasa.
Terobosan teknologi ini telah membangkitkan respons antusias di kalangan teknologi global, dan banyak pengembang serta anggota komunitas telah menunjukkan minat besar terhadap peluncuran MiniCPM-V2.6.
Saat ini, alamat sumber terbuka GitHub dan Hugging Face dari MiniCPM-V2.6 telah diumumkan ke publik, dan tautan ke tutorial penerapan llama.cpp, ollama, dan vllm telah disediakan.
Alamat sumber terbuka MiniCPM-V2.6GitHub:
https://github.com/OpenBMB/MiniCPM-V
Alamat sumber terbuka MiniCPM-V2.6Hugging Face:
https://huggingface.co/openbmb/MiniCPM-V-2_6
llama.cpp, ollama, alamat tutorial penerapan vllm:
https://modelbest.feishu.cn/docx/Duptdntfro2Clfx2DzuczHxAnhc
Sumber terbuka MiniCPM-V2.6 memberi pengembang alat yang canggih dan tutorial penerapan yang mudah digunakan. Hal ini diyakini akan mendorong pengembangan teknologi model multi-modal sisi akhir di masa depan dan membawa kemungkinan inovatif ke lebih banyak skenario aplikasi. Editor Downcodes akan terus memperhatikan kemajuan selanjutnya, jadi pantau terus!