Tim UCSC-VLAA merilis kumpulan data medis multimodal berukuran besar MedTrinity-25M, yang berisi 25 juta gambar medis dan anotasi terperinci, menandai lompatan besar dalam sumber daya data di bidang medis. Anotasi multi-butir pada kumpulan data ini memungkinkan peneliti untuk memahami dan menerapkan data medis secara lebih mendalam dan memberikan dasar yang kuat untuk melatih model besar multi-modal medis tingkat lanjut. Proses konstruksi MedTrinity-25M menggabungkan berbagai teknologi, termasuk pemrosesan data yang canggih, integrasi metadata, pembuatan deskripsi dengan bantuan model bahasa skala besar (MLLM), dll., yang secara signifikan meningkatkan kegunaan dan nilai penelitian data.
Kumpulan data multimodal skala besar "MedTrinity-25M" dari tim UCSC-VLAA secara resmi dirilis. Kumpulan data ini berisi 25 juta gambar medis dan anotasi mendetail. Hal ini dapat digambarkan sebagai inovasi penting dalam bidang medis. Ia memiliki anotasi multi-granular yang dapat membantu peneliti lebih memahami dan menerapkan data medis dan digunakan untuk melatih model medis multi-modal besar.
Proses konstruksi MedTrinity-25M cukup rumit. Setelah pemrosesan data yang cermat, tim mengekstraksi informasi penting yang diperoleh dari berbagai jenis data, metadata terintegrasi, menghasilkan judul kasar, menemukan area yang diminati, dan mengumpulkan informasi medis yang relevan. Yang lebih menarik adalah mereka menggunakan informasi ini untuk menghasilkan deskripsi rinci menggunakan model bahasa skala besar (MLLM). Pendekatan ini tidak hanya meningkatkan ketersediaan data tetapi juga membuka arah baru bagi penelitian medis.
Berbicara tentang proses rilis, perlu disebutkan bahwa kumpulan data Demo MedTrinity-25M telah online pada awal Juni 2024, sedangkan kumpulan data lengkap secara resmi dirilis pada 21 Juli, dan yang terbaru pada 7 Agustus, mereka juga menerbitkannya. makalah terkait.
Selain kumpulan data itu sendiri, tim juga menyediakan serangkaian model terlatih, seperti LLaVA-Med++, yang berkinerja baik dalam berbagai tugas medis. Para peneliti dapat menggunakan alat-alat ini untuk menyelesaikan proyek mereka dengan lebih baik, sehingga sangat meningkatkan efisiensi penelitian medis.
MedTrinity-25M menyediakan sumber daya yang berharga bagi komunitas medis. Saya berharap semua orang dapat memanfaatkan sepenuhnya kumpulan data ini untuk mendorong pengembangan penelitian medis.
Pintu masuk proyek: https://top.aibase.com/tool/medtrinity-25m
Peluncuran kumpulan data MedTrinity-25M dan model pendukungnya memberikan dorongan kuat untuk penelitian kecerdasan buatan medis. Kami berharap kumpulan data ini dapat mendorong terobosan dalam analisis citra medis, diagnosis penyakit, dan bidang lainnya, dan pada akhirnya memberikan manfaat bagi lebih banyak pasien. Para peneliti dipersilakan untuk mengunjungi portal proyek untuk mempelajari lebih lanjut dan memanfaatkan sumber daya yang berharga ini.