Perusahaan AI domestik Deepseek merilis model multimodal Janus-Pro, secara resmi memasuki bidang grafik sastra dan biografi dan mencapai hasil yang luar biasa. Produk ini, berdasarkan upgrade model JanusFlow, melampaui model terkenal seperti Openai's Dall-E3 dalam berbagai tolok ukur. Langkah Deepseek menandai terobosan yang signifikan dalam teknologi AI multimodal dan menyuntikkan vitalitas baru ke dalam pengembangan AI domestik.
Model besar domestik Deepseek telah merilis model besar multimodal Janus-Pro baru, secara resmi memasuki bidang grafik sastra dan biografi. Langkah ini menandai terobosan besar di Deepseek dalam teknologi AI multimodal.
Dalam tolok ukur Geneval dan DPG-Bench, Janus-Pro-7b tidak hanya mengalahkan Openai's Dall-E3, tetapi juga melampaui model populer seperti difusi stabil dan EMU3-gen. Janus-Pro mengadopsi protokol open source MIT, yang berarti dapat digunakan dalam skenario komersial tanpa batasan. Deepseek mengatakan Janus-Pro adalah versi premium dari mockup Janusflow yang dirilis pada 13 November 2024.
Dibandingkan dengan model generasi sebelumnya, Janus-Pro mengoptimalkan strategi pelatihan, memperluas data pelatihan, dan skala model lebih besar. Perbaikan-perbaikan ini telah memungkinkan Janus-Pro untuk membuat kemajuan yang signifikan dalam pemahaman multimodal dan kemampuan pelacakan instruksi teks-ke-gambar, sambil meningkatkan stabilitas pembuatan teks-ke-gambar.
Meskipun Janus-Pro hanya dapat memproses gambar dengan resolusi 384x384, sudah luar biasa untuk dapat mencapai level seperti itu mengingat ukuran model yang ringkas.
Sebagai model multimodal, Janus-Pro tidak hanya dapat menghasilkan gambar, tetapi juga menggambarkan gambar, mengidentifikasi atraksi tengara, mengidentifikasi teks dalam gambar, dan memperkenalkan pengetahuan dalam gambar.
Poin:
Deepseek merilis model multimodal Janus-Pro untuk memasuki bidang grafik sastra dan biografi.
Dalam tolok ukur, kinerja Janus-Pro-7b melampaui model populer seperti Openai's Dall-E3.
Janus-Pro menggunakan protokol open source MIT dan dapat digunakan dalam skenario komersial tanpa batasan.
Munculnya Janus-Pro menunjukkan bahwa kekuatan teknologi model besar domestik di bidang gambar sastra dan biografi meningkat dengan cepat. ke!