Unduh audioset downloader - audioset downloader Unduh kode sumber

audioset downloader

Kode sumber lainnya

Unduh

pengunduh audioset

Repositori ini menyediakan alat untuk mengunduh klip audio berlabel kuat dari AudioSet, kumpulan data peristiwa audio beranotasi berskala besar. Alat ini dapat digunakan untuk membuat kumpulan data audio label kuat khusus untuk tugas pembelajaran mesin.

Fitur

Unduh file audio secara efisien dari AudioSet berdasarkan label tertentu.
Mendukung banyak unduhan paralel untuk mempercepat proses.
Fleksibilitas untuk memilih jumlah file audio yang akan diunduh per label.
Sistem pencatatan yang nyaman untuk melacak proses pengunduhan.
Konfigurasi proses download dapat dilakukan melalui file config.yaml .

Persyaratan

python3
ffmpeg
youtube-dl

Penggunaan

Kloning repositori ini:

 git clone https://github.com/nama-pengguna-anda/audioset-downloader.git

Instal dependensi:

 instalasi pip -r persyaratan.txt

Jalankan skrip input_label.py untuk menghasilkan kamus label:

 python input_label.py

Buka file config.yaml dan tempel kamus label yang dibuat pada langkah sebelumnya. Ubah bidang lain dalam file sesuai keinginan.
Jalankan skrip main.py untuk mengunduh klip audio: Mengunduh file audio ke folder output/dataset di direktori saat ini.

 python main.py

Menggunakan file CSV yang ditemukan di core/ secara default. Jalankan main.py di direktorinya sendiri.

Konfigurasi

Konfigurasi alat ini ditentukan dalam file config.yaml. Bidang berikut tersedia:

labels : Daftar label yang akan diunduh.
labels_id_dict : Kamus memetakan label ke ID AudioSet.
csv_dataset : Jalur ke kumpulan data CSV.
workspace : Direktori ruang kerja.
destination_dir : Direktori tujuan untuk file audio yang diunduh.
fs : Frekuensi pengambilan sampel.
eval_rate : Tingkat evaluasi.
num_threads : Jumlah thread yang digunakan saat mengunduh.

Mengapa pengunduh untuk AudioSet diperlukan

Tepat sekali, itulah mengapa pengunduh untuk AudioSet diperlukan. File CSV yang disediakan oleh AudioSet hanya berisi informasi tentang ID YouTube dan label terkait, namun bukan data audio sebenarnya. Di sisi lain, file TFRecord berisi vektor fitur, tetapi bukan sinyal audio mentah, yang diperlukan untuk beberapa tugas pembelajaran mesin.

Dengan menggunakan pengunduh, pengguna dapat mengunduh data audio dalam format mentah dan menggunakannya untuk melatih model mereka. Alat ini dapat membantu menghemat waktu dan tenaga, karena pengguna tidak perlu mencari dan mendownload setiap klip audio dari YouTube secara manual. Pengguna juga dapat menggunakan alat ini untuk memfilter klip audio berdasarkan labelnya, sehingga memungkinkan mereka membuat kumpulan data label kuat khusus yang disesuaikan dengan kebutuhan spesifik mereka.

Kumpulan Audio

AudioSet dapat diunduh dari Google di sini sebagai kumpulan file CSV. Untuk setiap elemen dalam kumpulan data, file CSV mencantumkan ID YouTube terkait, waktu mulai, waktu berakhir, dan label kelas. File CSV digunakan untuk mengunduh AudioSet sebagai file audio mentah (WAV).

Penafian

Repositori ini hanya untuk tujuan pendidikan dan penelitian. Harap hormati syarat penggunaan dan perjanjian lisensi AudioSet saat menggunakan alat ini.

Memperluas

Informasi Tambahan

Versi
Tipe Kode sumber lainnya
Waktu Pembaruan 2024-11-21
ukuran 50MB
Berasal dari Github

Aplikasi Terkait

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15
VITAident

2024-12-15

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
waymo open dataset

Kode sumber lainnya

December 2023 Update
SmartTube

Kode sumber lainnya

24.71 Stable
Sunamu

Kode sumber lainnya

Release 2.2.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
wp functions

Kategori lainnya

1.0.0
termwind

Kategori lainnya

v2.3.0

Informasi Terkait Semua