Salesforce meluncurkan model AI multi-modal sumber terbuka xGen-MM untuk membantu pemahaman visual

Penulis：Eve Cole Waktu Pembaruan：2024-12-22 13:16:01

Salesforce telah membuat terobosan open source dari model AI multi-modal xGen-MM, alat canggih yang secara bersamaan dapat memahami dan menghasilkan beberapa tipe data seperti teks dan gambar. Model ini memiliki 4 miliar parameter dan telah berkinerja baik pada berbagai tolok ukur. Sifat open source-nya kontras dengan tren industri saat ini dan mencerminkan komitmen Salesforce untuk mempromosikan penelitian terbuka di bidang AI. xGen-MM unik dalam kemampuannya memproses "data yang disisipkan", yang memungkinkannya melakukan tugas yang lebih kompleks seperti menjawab pertanyaan tentang banyak gambar secara bersamaan, dengan potensi aplikasi yang sangat besar di berbagai bidang seperti diagnostik medis dan mengemudi otonom.

Salesforce telah meluncurkan serangkaian model AI multi-modal sumber terbuka yang disebut xGen-MM. Rangkaian model ini secara bersamaan dapat memahami dan menghasilkan beberapa tipe data seperti teks dan gambar, dan mungkin sepenuhnya mengubah cara kita meneliti dan menerapkan AI.

Tim peneliti Salesforce AI menerbitkan makalah tentang arXiv yang merinci kerangka kerja xGen-MM. Kerangka kerja ini tidak hanya mencakup model terlatih, tetapi juga kumpulan data dan kode penyesuaian. Perlu disebutkan bahwa model terbesar ini memiliki 4 miliar parameter, dan kinerjanya telah menunjukkan kinerja yang baik dalam berbagai pengujian benchmark, tidak kalah dengan model sumber terbuka serupa.

Langkah open source ini benar-benar berbeda dari tren saat ini dimana banyak raksasa teknologi memilih untuk merahasiakan model AI canggih. Salesforce berharap dapat mendorong penelitian dan pengembangan yang lebih luas dengan membuka model dan kumpulan data. Bahkan, keputusan ini juga untuk memberikan kesempatan lebih banyak peneliti dan pengembang untuk berpartisipasi dalam kemajuan teknologi AI multimodal.

Salah satu inovasi xGen-MM adalah kemampuannya menangani "data interleaved", yaitu dapat memproses banyak gambar dan teks secara bersamaan. Kemampuan ini memungkinkan model untuk melakukan tugas yang lebih kompleks, seperti menjawab pertanyaan tentang beberapa gambar secara bersamaan, dan ini sungguh luar biasa! Skenario aplikasi seperti itu mungkin sangat berguna dalam bidang seperti diagnosis medis dan mengemudi otonom.

Rilis ini juga mencakup beberapa versi model yang dioptimalkan, seperti model dasar yang telah dilatih sebelumnya, model yang disetel untuk mengikuti instruksi, dan model "yang disesuaikan dengan keselamatan" yang dirancang untuk mengurangi keluaran berbahaya. Pilihan yang beragam ini mencerminkan meningkatnya penekanan komunitas AI pada keseimbangan antara kemampuan dan etika keselamatan.

Namun, peluncuran model-model canggih juga telah memicu diskusi tentang potensi risiko dan dampak sosial dari sistem AI yang lebih canggih. Meskipun Salesforce telah melakukan penyesuaian keamanan untuk mengurangi risiko, bagaimana menyeimbangkan inovasi dan keamanan masih merupakan pertanyaan yang patut direnungkan.

Rilis sumber terbuka dari Salesforce ini memberi para peneliti alat yang berharga untuk lebih memahami dan meningkatkan teknologi canggih ini. Pada saat yang sama, hal ini juga menjadi tolok ukur baru bagi transparansi di bidang AI, yang mungkin mendorong raksasa teknologi lainnya untuk lebih terbuka mengenai penelitian mereka.

Pintu masuk model: https://huggingface.co/collections/Salesforce/xgen-mm-1-models-662971d6cecbf3a7f80ecc2e

Menyorot:

xGen-MM adalah serangkaian model AI multi-modal sumber terbuka yang diluncurkan oleh Salesforce yang mendukung pemahaman komprehensif serta pembuatan teks dan gambar.

Model tersebut memiliki kemampuan mengolah data yang disisipkan dan dapat menjawab pertanyaan tentang banyak gambar sekaligus, sehingga memiliki prospek penerapan yang luas.

? Rilis ini mencakup berbagai versi yang dioptimalkan, memperhatikan masalah keselamatan dan etika, dan menyediakan sumber daya yang kaya bagi para peneliti.

Secara keseluruhan, xGen-MM open source Salesforce merupakan kemajuan besar di bidang AI. Ini tidak hanya menyediakan alat yang canggih, tetapi juga memberikan contoh arah penelitian dan pengembangan AI yang lebih terbuka dan bertanggung jawab penerapan dan pengembangannya di masa depan di berbagai bidang.