Ini adalah aplikasi demo Swift untuk model SAM 2 Core ML.
SAM 2 (Segmen Apa Pun dalam Gambar dan Video), adalah kumpulan model dasar dari FAIR yang bertujuan untuk memecahkan segmentasi visual yang cepat dalam gambar dan video. Lihat makalah SAM 2 untuk informasi lebih lanjut.
Unduh versi kompilasinya di sini.
Jika Anda lebih suka mengompilasinya sendiri atau ingin menggunakan model yang lebih besar, cukup unduh repo, kompilasi dengan Xcode, dan jalankan. Aplikasi ini hadir dengan model versi Kecil, tetapi Anda dapat menggantinya dengan salah satu model yang didukung:
SAM 2.1 Kecil
SAM 2.1 Kecil
Basis SAM 2.1
SAM 2.1 Besar
Untuk model lama, silakan periksa organisasi Apple di HuggingFace.
Demo ini mendukung gambar, dukungan video akan menyusul nanti.
Anda dapat memilih satu atau lebih titik latar depan untuk memilih objek pada gambar. Setiap poin tambahan diartikan sebagai penyempurnaan dari topeng sebelumnya.
Gunakan titik latar belakang untuk menunjukkan area yang akan dihapus dari masker saat ini.
Anda dapat menggunakan kotak untuk memilih perkiraan area yang berisi objek yang Anda minati.
Jika Anda ingin menggunakan model yang disempurnakan, Anda dapat mengonversinya menggunakan fork repo SAM 2 ini. Tolong, beri tahu kami untuk apa Anda menggunakannya!
Masukan, isu, dan PR dipersilakan! Silakan menghubungi kami.
Untuk mengutip makalah, model, atau perangkat lunak SAM 2, silakan gunakan di bawah ini:
@article{ravi2024sam2, title={SAM 2: Segment Anything in Images and Videos}, author={Ravi, Nikhila and Gabeur, Valentin and Hu, Yuan-Ting and Hu, Ronghang and Ryali, Chaitanya and Ma, Tengyu and Khedr, Haitham and R{"a}dle, Roman and Rolland, Chloe and Gustafson, Laura and Mintun, Eric and Pan, Junting and Alwala, Kalyan Vasudev and Carion, Nicolas and Wu, Chao-Yuan and Girshick, Ross and Doll{'a}r, Piotr and Feichtenhofer, Christoph}, journal={arXiv preprint arXiv:2408.00714}, url={https://arxiv.org/abs/2408.00714}, year={2024} }