? Alat Anotasi & Pelabelan Data Sumber Terbuka
Di ZenML kami percaya bahwa alur kerja anotasi dan pelabelan adalah bagian inti dari siklus hidup pembelajaran mesin. Sebagai alat sumber terbuka, kami ingin menyoroti dan mengenali beragam alat yang tersedia untuk membantu alur kerja Anda menjadi lebih berpusat pada data. Kami memiliki tiga kriteria inti untuk memutuskan apakah alat tertentu dapat masuk dalam daftar:
- Alat ini memiliki lisensi sumber terbuka.
- Alat ini dipelihara secara aktif.
- Alat ini berfungsi dan sesuai dengan tujuannya.
Kami menyambut baik kontribusi pada daftar ini, jadi jika Anda mengetahui alat yang kami lewatkan atau jika Anda membuatnya sendiri, silakan buat PR!
Apakah Anda menggunakan alat ini atau ingin menambahkannya ke tumpukan MLOps Anda? Di ZenML, kami mencari kemitraan desain dan kolaborasi untuk mengembangkan integrasi dan alur kerja seputar penggunaan anotasi dalam siklus hidup MLOps. Jika Anda ingin mempelajari lebih lanjut, silakan bergabung dengan Slack kami dan tinggalkan pesan kepada kami!
Isi
- Multi Modal / Multi Domain
- Teks
- Gambar
- Audio
- Video
- Rangkaian Waktu
- Lainnya
Multi Modal / Multi Domain
Nama | Keterangan | Lisensi |
---|
Acharya | Alat MLOps Pusat Data untuk proyek Pengenalan Entitas Bernama Anda | ? |
Adala | Kerangka kerja Agen Data Otonom (Pelabelan). | Apache-2 |
Klasifikasi | Platform anotasi data sumber terbuka yang komprehensif | Apache-2 |
Alat Anotasi Computer Vision (CVAT) | Alat anotasi video dan gambar interaktif gratis, online, untuk visi komputer | MIT |
Anotator Data untuk Pembelajaran Mesin (DAML) | Aplikasi yang membantu tim pembelajaran mesin memfasilitasi pembuatan dan pengelolaan anotasi | Apache-2 |
DataGym | Alat anotasi dan pelabelan sumber terbuka untuk aset gambar dan video | MIT |
Diffgram | Data Pelatihan (Pelabelan Data, Anotasi, Alur Kerja) untuk semua Tipe Data (Gambar, Video, 3D, Teks, Geo, Audio, lainnya) dalam skala besar | ELv2 |
Arahkan kursor | Jelajahi dan beri label pada peta data mentah. Menangani teks, audio dan gambar. | MIT |
Studio Label | Alat pelabelan dan anotasi data multi-tipe dengan format keluaran standar | Apache-2 |
Merpati | Widget sederhana yang memungkinkan Anda dengan cepat membuat anotasi pada kumpulan data contoh tak berlabel dari kenyamanan buku catatan Jupyter Anda | Apache-2 |
QSL: Pelabelan Cepat dan Sederhana | Alat cepat dan sederhana untuk memberi label pada gambar, video, dan data deret waktu, langsung dari Jupyter | MIT |
Shonya | Platform untuk memberi anotasi dan memberi label pada data dalam skala besar | MIT |
Tato | Platform web analisis video | AGPL-3 |
TornadoAi | Kerangka kerja pembelajaran mesin yang bersifat human-in-the-loop | AGPL-3 |
Alat Data Universal | Aplikasi web/desktop untuk mengedit dan memberi anotasi pada gambar, teks, audio, dokumen, dan untuk melihat serta mengedit data apa pun yang ditentukan dalam standar .udt.json dan .udt.csv yang dapat diperluas | MIT |
Anotator Gambar VGG (VIA) | Aplikasi anotator gambar mandiri yang dikemas sebagai satu file HTML (<400 KB) yang berjalan di sebagian besar browser web modern | BSD-2 |
VIAME | Analisis Video dan Gambar untuk Berbagai Lingkungan | Kebiasaan |
Xtreme1 | Platform pelabelan dan anotasi data lengkap untuk pelatihan data multimodal dan mendukung point cloud, gambar, dan LLM LiDAR 3D | Apache-2 |
Teks
Nama | Keterangan | Lisensi |
---|
Lab Anotasi | Alat anotasi NLP yang disertakan dalam spark-nlp | Apache-2 |
Argilla | Kerangka kerja Python siap produksi untuk menjelajahi, membuat anotasi, dan mengelola data dalam proyek NLP | Apache-2 |
dalam jumlah besar | Massal adalah alat pengembang cepat untuk menerapkan beberapa label massal | MIT |
IntiNLP | Rangkaian alat NLP inti Java | GPL-3 |
DataQA | Pelabelan platform untuk teks menggunakan pengawasan yang lemah | GPL-3 |
doccano | Alat anotasi teks sumber terbuka yang mendukung klasifikasi teks, pelabelan urutan, dan tugas urutan ke urutan | MIT |
FLAT - Alat Anotasi Linguistik FoLiA | Lingkungan anotasi linguistik berbasis web berdasarkan format FoLiA, format berbasis XML untuk anotasi linguistik | GPL-3 |
Lahirnya | Platform anotasi semantik yang menawarkan bantuan anotasi cerdas dan manajemen pengetahuan | Apache-2 |
tahu | Knodle (Kerangka Pembelajaran Mendalam yang diawasi Pengetahuan) | Apache-2 |
Menandai | Alat anotasi dokumen berbasis web, didukung oleh GPT-4 | Tidak dikenal |
Anotator NER untuk Spacy | NER Annotator untuk SpaCy memungkinkan Anda membuat data pelatihan untuk membuat Model NER khusus dengan tag khusus. | MIT |
NPLM | Model Label Parsial Bising (NPLM) | T/A |
Kentang | Kerangka kerja anotasi dengan 20+ templat, UI yang dapat diedit, kontrol kualitas, manajemen data, dan opsi untuk menambahkan survei untuk crowdsourcing | Perisai PoliForm |
kilang minyak | Pilihan sumber terbuka para data scientist untuk menskalakan, menilai, dan memelihara data bahasa alami. | Apache-2 |
Batu tulis | Alat Anotasi Super Ringan untuk Para Ahli: Memberi label pada teks di terminal hanya dengan Python | ISC |
CERDAS | Alat untuk membuat kumpulan data pelatihan berlabel untuk tugas pembelajaran mesin yang diawasi di NLP | MIT |
Anotator SpaCy | Anotator Spacy NER menggunakan ipywidgets | T/A |
Teks Kecil | Pembelajaran Aktif untuk Klasifikasi Teks | MIT |
Snorkel | Membangun dan Mengelola Data Pelatihan Secara Terprogram | Apache-2 |
lemah | skweak: Lemahnya pengawasan untuk NLP | MIT |
TALEN | Sebuah cara untuk melakukan anotasi untuk NER | Kebiasaan |
Tema | Alat pelabelan CLI minimalis untuk klasifikasi teks | MIT |
YEDDA | Alat anotasi rentang teks kolaboratif yang ringan | Apache-2 |
Musang | WeaSEL: Pembelajaran End-to-end yang Diawasi dengan Lemah | Apache-2 |
Gambar
Nama | Keterangan | Lisensi |
---|
Pemotong 3D | Visualisasi, pemrosesan, segmentasi, registrasi, dan analisis gambar dan jerat medis, biomedis, dan 3D lainnya | BSD |
Lab Anotasi | Menyederhanakan Anotasi Gambar | MIT |
Menjijikkan | Pustaka JavaScript untuk anotasi gambar | BSD-3 |
Pelabelan Apa Pun | Pelabelan data berbantuan AI yang mudah dengan dukungan AI dari YOLO, Segment Anything, MobileSAM | GPL-3 |
penyulingan otomatis | Gambar untuk disimpulkan tanpa pelabelan (gunakan model dasar untuk melatih model yang diawasi) | Apache-2 |
bbox-visualisator | Membuat menggambar dan memberi label pada kotak pembatas semudah kue | MIT |
Editor Kotak Pembatas | Aplikasi desktop JavaFX untuk membuat anotasi objek gambar dengan kotak pembatas | GPL-3 |
KATMAID | Perangkat Anotasi Kolaboratif untuk Data Gambar dalam Jumlah Besar | GPL-3 |
Anotasi COCO | Alat segmentasi gambar berbasis web untuk deteksi objek, lokalisasi, dan titik kunci | MIT |
Label Dalam | Alat anotasi gambar desktop lintas platform untuk pembelajaran mesin | MIT |
ilastik | Segmentasikan, klasifikasikan, lacak dan hitung sel Anda atau data eksperimen lainnya | Kebiasaan |
Penanda Gambar | Platform online sumber terbuka untuk pelabelan gambar kolaboratif | MIT |
imglab | Alat berbasis web untuk memberi label gambar pada objek yang dapat digunakan untuk melatih dlib atau pendeteksi objek lainnya | MIT |
KNOSSOS | Alat perangkat lunak untuk visualisasi dan anotasi data gambar 3D dan dikembangkan untuk rekonstruksi cepat morfologi dan konektivitas saraf | GPL-2 |
labelCloud | Alat ringan untuk memberi label pada kotak pembatas 3D di point cloud | GPL-3 |
LabelFlow | Platform terbuka untuk pelabelan gambar | Kebiasaan |
labelme | Anotasi Poligonal Gambar dengan Python (anotasi poligon, persegi panjang, lingkaran, garis, titik, dan bendera tingkat gambar) | Kebiasaan |
LabelImg | Alat anotasi gambar grafis dan kotak pembatas objek label dalam gambar | MIT |
HILANG | Kerangka kerja berbasis web yang fleksibel untuk anotasi gambar semi-otomatis | MIT |
Masuk akal | Alat online gratis untuk memberi label pada foto | GPL-3 |
Visi Saya | Alat pembuatan data pelatihan ML berbasis visi komputer | GPL-3 |
Penampil Pencitraan Medis OHIF | OHIF penampil DICOM tanpa jejak dan Pelacak Lesi khusus onkologi | MIT |
Pelabel Terbuka | Aplikasi desktop sumber terbuka untuk membuat anotasi objek untuk aplikasi AI | Apache-2 |
Pixano | Alat anotasi cerdas berbasis web untuk aplikasi visi komputer | CeCILL-C |
skalalabel | Alat anotasi data visual berbasis web, mendukung pelabelan data 2D dan 3D | Apache-2 |
webKnossos | Alat anotasi 3D yang sepenuhnya berbasis cloud dan browser untuk mendistribusikan analisis data skala besar dalam Connectomics berbasis mikroskop cahaya dan elektron | AGPL-3 |
Yolo_Label | GUI untuk menandai kotak objek yang dibatasi dalam gambar untuk melatih jaringan saraf YOLO | MIT |
Video
Nama | Keterangan | Lisensi |
---|
MENYELAM | Anotasi media dan alat analisis untuk web dan desktop | Apache-2 |
Pelabelan Utama | GUI Pelabelan Video serbaguna dengan Python dengan detektor dan pelacak SOTA terintegrasi | MIT |
Audio
Nama | Keterangan | Lisensi |
---|
aubio | Perpustakaan untuk analisis audio dan musik | GPL-3 |
audio | Alat anotasi audio sumber terbuka | MIT |
Praat | Alat anotasi untuk analisis fonetik | GPL-3 |
Puncak.js | Komponen UI JavaScript untuk berinteraksi dengan bentuk gelombang audio | LGPL-3 |
Wavesurfer.js | Bentuk gelombang yang dapat dinavigasi berdasarkan Audio Web dan Kanvas | BSD-3 |
Rangkaian Waktu
Nama | Keterangan | Lisensi |
---|
waktu sk | Kerangka kerja untuk pembelajaran mesin dengan deret waktu | BSD-3 |
Lainnya
Nama | Keterangan | Lisensi |
---|
Menyusun | Rekayasa prediksi otomatis. Memungkinkan Anda dengan mudah menyusun masalah prediksi dan membuat label untuk pembelajaran yang diawasi | BSD-3 |
Enkord Aktif | Toolkit untuk menguji, memvalidasi, dan mengevaluasi model Anda serta menampilkan, mengkurasi, dan memprioritaskan data paling berharga untuk pelabelan | Apache-2 |
NeuroTrale | Perangkat lunak anotasi untuk pemetaan otak, mendukung pencitraan 3D dan anotasi | BSD-2 |
BukaCRAVAT | Alat anotasi modular untuk varian genom | MIT |
Penyortir Patch | Alat patologi digital sumber terbuka untuk pelabelan objek histologis | BSD-3 |
Reporter Genom Kanker Pribadi (PCGR) | Paket perangkat lunak yang berdiri sendiri untuk penerjemahan genom tumor individu untuk pengobatan kanker yang presisi | MIT |
Aneh | Kumpulkan Penilaian Manusia (alias Peringkat Eksplisit) untuk Kualitas Pencarian. Juga tempat yang aman untuk bermain-main dengan algoritma pencarian Anda. | Apache-2 |
Ucapan Terima Kasih
Terima kasih kepada pembuat repositori lain ini (dan yang ini!) yang telah membantu kami membuat repositori kami sendiri. Saya menggunakan upaya ini untuk memulai survei ruang sebelum menambahkan, memperbarui, dan memangkas sesuai sumber terbuka dan kriteria lain yang ditentukan di atas.