Tim OpenCompass dari Shanghai Artificial Intelligence Laboratory Sinan dan ModelScope bersama-sama meluncurkan pembaruan besar platform kompetisi model besar multi-modal Compass Multi-Modal Arena! Platform ini bertujuan untuk menyediakan platform yang nyaman bagi pengguna untuk merasakan dan membandingkan berbagai model besar multimodal arus utama, dan pada akhirnya membantu pengguna menemukan model yang paling sesuai dengan kebutuhan mereka. Editor Downcodes akan memperkenalkan pembaruan menarik ini kepada Anda secara mendetail.
Tim OpenCompass dari Shanghai Artificial Intelligence Laboratory Sinan dan ModelScope baru-baru ini mengumumkan bahwa platform evaluasi model besar mereka, Compass Arena, telah mengalami pembaruan penting dan meluncurkan bagian kompetisi model besar multi-modal baru, Compass Multi-Modal Arena. Bagian baru ini menyediakan platform bagi pengguna untuk merasakan dan membandingkan efek dari berbagai model besar multimodal arus utama, membantu pengguna menemukan model yang paling sesuai dengan kebutuhan mereka.
Situs web resmi dan halaman ModelScope Compass Multi-Modal Arena telah dibuka untuk umum, menyediakan antarmuka yang sederhana dan mudah digunakan. Pengguna dapat mengunggah gambar dan memasukkan pertanyaan, dan sistem akan mengatur dua model besar multi-modal anonim untuk menghasilkan jawaban berdasarkan konten input. Pengguna melakukan evaluasi subjektif berdasarkan kualitas konten yang dihasilkan, memilih model yang mereka yakini memiliki kinerja lebih baik. Setelah evaluasi selesai, pengguna dapat melihat nama masing-masing model.
Platform ini juga memiliki bank soal khusus bawaan, yang nyaman digunakan pengguna saat mengunggah gambar tidak nyaman. Bank soal berfokus pada tugas tanya jawab visual subjektif, seperti pemahaman meme, apresiasi karya seni, dan apresiasi fotografi. Desain ini bertujuan untuk mengevaluasi kinerja dan pengalaman pengguna model besar multi-modal pada tugas subjektif.
Situs resmi Kompas Multi-Modal Arena
https://opencompass.org.cn/arena?type=multimodal
Halaman ModelScope:
https://modelscope.cn/studios/opencompass/CompassArena
Halaman HuggingFace
https://huggingface.co/spaces/opencompass/CompassArena
Tautan sumber terbuka alat evaluasi multimodal OpenCompass:
https://github.com/open-compass/VLMEvalKit
Secara keseluruhan, pembaruan Compass Multi-Modal Arena menyediakan platform baru dan nyaman untuk evaluasi dan pemilihan model multi-modal besar, yang layak untuk mendapatkan pengalaman dan perhatian pengguna. Kami menantikan pembaruan berkelanjutan dari platform ini di masa mendatang untuk menghadirkan lebih banyak kejutan bagi pengguna!