Apple baru-baru ini merilis model dasar multi-modal berskala besar MM1, dengan ukuran parameter 30 miliar dan arsitektur hybrid expert (MoE). Perlu dicatat bahwa lebih dari separuh anggota tim penelitian dan pengembangan model ini adalah orang Tiongkok, yang mencerminkan kontribusi penting ilmuwan Tiongkok di bidang kecerdasan buatan. MM1 berkinerja baik dalam pengujian benchmark multi-modal, yang menunjukkan bahwa Apple telah membuat terobosan besar di bidang kecerdasan buatan generatif dan mungkin meletakkan dasar yang kokoh untuk pengembangan produk di masa depan. Model ini menggunakan varian MoE dan memimpin dalam indikator pra-pelatihan dan beberapa uji benchmark multi-modal. Para peneliti juga telah memverifikasi pentingnya arsitektur model dan pemilihan data pra-pelatihan melalui beberapa eksperimen ablasi.
Apple merilis model dasar multi-modal berskala besar yang disebut MM1 dengan 30 miliar parameter, menggunakan arsitektur MoE, dan lebih dari separuh penulisnya adalah orang Tiongkok. Model ini sangat penting dalam bidang multimodal dan mungkin menjadi pertanda peluncuran produk terkait oleh Apple di masa depan. Apple telah meningkatkan investasinya di bidang kecerdasan buatan generatif, yang menunjukkan tekadnya untuk mencapai kemajuan yang signifikan. MM1 mengadopsi varian Kementerian Lingkungan Hidup dan memimpin dalam indikator pra-pelatihan dan beberapa uji tolok ukur multimodal. Para peneliti mengeksplorasi pentingnya arsitektur model dan pemilihan data pra-pelatihan melalui beberapa eksperimen ablasi.Peluncuran MM1 menandai langkah penting bagi Apple di bidang kecerdasan buatan. Performanya yang bertenaga dan kontribusi tim Tiongkok patut mendapat perhatian. Di masa depan, Apple diperkirakan akan meluncurkan lebih banyak produk dan layanan inovatif berdasarkan MM1 untuk lebih mempromosikan pengembangan dan penerapan teknologi kecerdasan buatan multi-modal.