Repositori ini menyediakan alat untuk mengunduh klip audio berlabel kuat dari AudioSet, kumpulan data peristiwa audio beranotasi berskala besar. Alat ini dapat digunakan untuk membuat kumpulan data audio label kuat khusus untuk tugas pembelajaran mesin.
Unduh file audio secara efisien dari AudioSet berdasarkan label tertentu.
Mendukung banyak unduhan paralel untuk mempercepat proses.
Fleksibilitas untuk memilih jumlah file audio yang akan diunduh per label.
Sistem pencatatan yang nyaman untuk melacak proses pengunduhan.
Konfigurasi proses download dapat dilakukan melalui file config.yaml
.
python3
ffmpeg
youtube-dl
Kloning repositori ini:
git clone https://github.com/nama-pengguna-anda/audioset-downloader.git
Instal dependensi:
instalasi pip -r persyaratan.txt
Jalankan skrip input_label.py
untuk menghasilkan kamus label:
python input_label.py
Buka file config.yaml dan tempel kamus label yang dibuat pada langkah sebelumnya. Ubah bidang lain dalam file sesuai keinginan.
Jalankan skrip main.py untuk mengunduh klip audio: Mengunduh file audio ke folder output/dataset
di direktori saat ini.
python main.py
Menggunakan file CSV yang ditemukan di core/
secara default. Jalankan main.py
di direktorinya sendiri.
Konfigurasi alat ini ditentukan dalam file config.yaml. Bidang berikut tersedia:
labels
: Daftar label yang akan diunduh.
labels_id_dict
: Kamus memetakan label ke ID AudioSet.
csv_dataset
: Jalur ke kumpulan data CSV.
workspace
: Direktori ruang kerja.
destination_dir
: Direktori tujuan untuk file audio yang diunduh.
fs
: Frekuensi pengambilan sampel.
eval_rate
: Tingkat evaluasi.
num_threads
: Jumlah thread yang digunakan saat mengunduh.
Tepat sekali, itulah mengapa pengunduh untuk AudioSet diperlukan. File CSV yang disediakan oleh AudioSet hanya berisi informasi tentang ID YouTube dan label terkait, namun bukan data audio sebenarnya. Di sisi lain, file TFRecord berisi vektor fitur, tetapi bukan sinyal audio mentah, yang diperlukan untuk beberapa tugas pembelajaran mesin.
Dengan menggunakan pengunduh, pengguna dapat mengunduh data audio dalam format mentah dan menggunakannya untuk melatih model mereka. Alat ini dapat membantu menghemat waktu dan tenaga, karena pengguna tidak perlu mencari dan mendownload setiap klip audio dari YouTube secara manual. Pengguna juga dapat menggunakan alat ini untuk memfilter klip audio berdasarkan labelnya, sehingga memungkinkan mereka membuat kumpulan data label kuat khusus yang disesuaikan dengan kebutuhan spesifik mereka.
AudioSet dapat diunduh dari Google di sini sebagai kumpulan file CSV. Untuk setiap elemen dalam kumpulan data, file CSV mencantumkan ID YouTube terkait, waktu mulai, waktu berakhir, dan label kelas. File CSV digunakan untuk mengunduh AudioSet sebagai file audio mentah (WAV).
Repositori ini hanya untuk tujuan pendidikan dan penelitian. Harap hormati syarat penggunaan dan perjanjian lisensi AudioSet saat menggunakan alat ini.