ดาวน์โหลด audioset downloader - ดาวน์โหลด audioset downloader ซอร์สโค้ด

audioset downloader

ซอร์สโค้ดอื่น ๆ

ดาวน์โหลด

โปรแกรมดาวน์โหลดชุดเสียง

พื้นที่เก็บข้อมูลนี้มีเครื่องมือในการดาวน์โหลดคลิปเสียงที่มีป้ายกำกับชัดเจนจาก AudioSet ซึ่งเป็นชุดข้อมูลขนาดใหญ่ของเหตุการณ์เสียงที่มีคำอธิบายประกอบ เครื่องมือนี้ใช้เพื่อสร้างชุดข้อมูลเสียงป้ายกำกับที่แข็งแกร่งที่กำหนดเองสำหรับงานแมชชีนเลิร์นนิงได้

คุณสมบัติ

ดาวน์โหลดไฟล์เสียงอย่างมีประสิทธิภาพจาก AudioSet ตามป้ายกำกับเฉพาะ
รองรับการดาวน์โหลดแบบขนานหลายรายการเพื่อเร่งกระบวนการ
ความยืดหยุ่นในการเลือกจำนวนไฟล์เสียงที่จะดาวน์โหลดต่อค่ายเพลง
ระบบบันทึกที่สะดวกเพื่อติดตามกระบวนการดาวน์โหลด
การกำหนดค่ากระบวนการดาวน์โหลดสามารถทำได้ผ่านไฟล์ config.yaml

ความต้องการ

หลาม3
ffmpeg
youtube-dl

การใช้งาน

โคลนที่เก็บนี้:

 โคลนคอมไพล์ https://github.com/your-username/audioset-downloader.git

ติดตั้งการพึ่งพา:

 pip ติดตั้ง -r ข้อกำหนด.txt

รันสคริปต์ input_label.py เพื่อสร้างพจนานุกรมป้ายกำกับ:

 หลาม input_label.py

เปิดไฟล์ config.yaml และวางพจนานุกรมป้ายกำกับที่สร้างขึ้นในขั้นตอนก่อนหน้า แก้ไขฟิลด์อื่นๆ ในไฟล์ตามต้องการ
เรียกใช้สคริปต์ main.py เพื่อดาวน์โหลดคลิปเสียง: ดาวน์โหลดไฟล์เสียงไปยังโฟลเดอร์ output/dataset ในไดเร็กทอรีปัจจุบัน

 หลาม main.py

ใช้ไฟล์ CSV ที่พบใน core/ โดยค่าเริ่มต้น ดำเนินการ main.py ในไดเร็กทอรีของตัวเอง

การกำหนดค่า

การกำหนดค่าของเครื่องมือระบุไว้ในไฟล์ config.yaml มีฟิลด์ต่อไปนี้:

labels : รายการป้ายกำกับที่จะดาวน์โหลด
labels_id_dict : การแมปป้ายกำกับพจนานุกรมกับ AudioSet ID
csv_dataset : เส้นทางไปยังชุดข้อมูล CSV
workspace : ไดเรกทอรีพื้นที่ทำงาน
destination_dir : ไดเร็กทอรีปลายทางสำหรับไฟล์เสียงที่ดาวน์โหลด
fs : ความถี่สุ่มตัวอย่าง
eval_rate : อัตราการประเมิน
num_threads : จำนวนเธรดที่จะใช้เมื่อดาวน์โหลด

เหตุใดจึงต้องมีตัวดาวน์โหลดสำหรับ AudioSet

นั่นคือเหตุผลว่าทำไมจึงจำเป็นต้องมีตัวดาวน์โหลดสำหรับ AudioSet ไฟล์ CSV ที่ AudioSet มอบให้จะมีเฉพาะข้อมูลเกี่ยวกับ YouTube-ID และป้ายกำกับที่เกี่ยวข้องเท่านั้น แต่ไม่มีข้อมูลเสียงจริง ในทางกลับกัน ไฟล์ TFRecord มีเวกเตอร์ฟีเจอร์ แต่ไม่ใช่สัญญาณเสียงดิบ ซึ่งจำเป็นสำหรับงานแมชชีนเลิร์นนิงบางอย่าง

เมื่อใช้ตัวดาวน์โหลด ผู้ใช้จะสามารถดาวน์โหลดข้อมูลเสียงในรูปแบบ Raw และใช้เพื่อฝึกโมเดลของตนได้ เครื่องมือนี้สามารถช่วยประหยัดเวลาและความพยายาม เนื่องจากผู้ใช้ไม่ต้องค้นหาและดาวน์โหลดคลิปเสียงแต่ละคลิปจาก YouTube ด้วยตนเอง ผู้ใช้ยังสามารถใช้เครื่องมือเพื่อกรองคลิปเสียงตามป้ายกำกับ ช่วยให้พวกเขาสามารถสร้างชุดข้อมูลป้ายกำกับที่แข็งแกร่งที่กำหนดเองซึ่งปรับให้เหมาะกับความต้องการเฉพาะของพวกเขา

ชุดเสียง

AudioSet สามารถดาวน์โหลดได้จาก Google ที่นี่เป็นชุดไฟล์ CSV สำหรับแต่ละองค์ประกอบในชุดข้อมูล ไฟล์ CSV จะแสดงรหัส YouTube เวลาเริ่มต้น เวลาสิ้นสุด และป้ายกำกับคลาสที่เกี่ยวข้อง ไฟล์ CSV ใช้เพื่อดาวน์โหลด AudioSet เป็นไฟล์เสียงดิบ (WAV)