พื้นที่เก็บข้อมูลนี้มีเครื่องมือในการดาวน์โหลดคลิปเสียงที่มีป้ายกำกับชัดเจนจาก AudioSet ซึ่งเป็นชุดข้อมูลขนาดใหญ่ของเหตุการณ์เสียงที่มีคำอธิบายประกอบ เครื่องมือนี้ใช้เพื่อสร้างชุดข้อมูลเสียงป้ายกำกับที่แข็งแกร่งที่กำหนดเองสำหรับงานแมชชีนเลิร์นนิงได้
ดาวน์โหลดไฟล์เสียงอย่างมีประสิทธิภาพจาก AudioSet ตามป้ายกำกับเฉพาะ
รองรับการดาวน์โหลดแบบขนานหลายรายการเพื่อเร่งกระบวนการ
ความยืดหยุ่นในการเลือกจำนวนไฟล์เสียงที่จะดาวน์โหลดต่อค่ายเพลง
ระบบบันทึกที่สะดวกเพื่อติดตามกระบวนการดาวน์โหลด
การกำหนดค่ากระบวนการดาวน์โหลดสามารถทำได้ผ่านไฟล์ config.yaml
หลาม3
ffmpeg
youtube-dl
โคลนที่เก็บนี้:
โคลนคอมไพล์ https://github.com/your-username/audioset-downloader.git
ติดตั้งการพึ่งพา:
pip ติดตั้ง -r ข้อกำหนด.txt
รันสคริปต์ input_label.py
เพื่อสร้างพจนานุกรมป้ายกำกับ:
หลาม input_label.py
เปิดไฟล์ config.yaml และวางพจนานุกรมป้ายกำกับที่สร้างขึ้นในขั้นตอนก่อนหน้า แก้ไขฟิลด์อื่นๆ ในไฟล์ตามต้องการ
เรียกใช้สคริปต์ main.py เพื่อดาวน์โหลดคลิปเสียง: ดาวน์โหลดไฟล์เสียงไปยังโฟลเดอร์ output/dataset
ในไดเร็กทอรีปัจจุบัน
หลาม main.py
ใช้ไฟล์ CSV ที่พบใน core/
โดยค่าเริ่มต้น ดำเนินการ main.py
ในไดเร็กทอรีของตัวเอง
การกำหนดค่าของเครื่องมือระบุไว้ในไฟล์ config.yaml มีฟิลด์ต่อไปนี้:
labels
: รายการป้ายกำกับที่จะดาวน์โหลด
labels_id_dict
: การแมปป้ายกำกับพจนานุกรมกับ AudioSet ID
csv_dataset
: เส้นทางไปยังชุดข้อมูล CSV
workspace
: ไดเรกทอรีพื้นที่ทำงาน
destination_dir
: ไดเร็กทอรีปลายทางสำหรับไฟล์เสียงที่ดาวน์โหลด
fs
: ความถี่สุ่มตัวอย่าง
eval_rate
: อัตราการประเมิน
num_threads
: จำนวนเธรดที่จะใช้เมื่อดาวน์โหลด
นั่นคือเหตุผลว่าทำไมจึงจำเป็นต้องมีตัวดาวน์โหลดสำหรับ AudioSet ไฟล์ CSV ที่ AudioSet มอบให้จะมีเฉพาะข้อมูลเกี่ยวกับ YouTube-ID และป้ายกำกับที่เกี่ยวข้องเท่านั้น แต่ไม่มีข้อมูลเสียงจริง ในทางกลับกัน ไฟล์ TFRecord มีเวกเตอร์ฟีเจอร์ แต่ไม่ใช่สัญญาณเสียงดิบ ซึ่งจำเป็นสำหรับงานแมชชีนเลิร์นนิงบางอย่าง
เมื่อใช้ตัวดาวน์โหลด ผู้ใช้จะสามารถดาวน์โหลดข้อมูลเสียงในรูปแบบ Raw และใช้เพื่อฝึกโมเดลของตนได้ เครื่องมือนี้สามารถช่วยประหยัดเวลาและความพยายาม เนื่องจากผู้ใช้ไม่จำเป็นต้องค้นหาและดาวน์โหลดคลิปเสียงแต่ละคลิปจาก YouTube ด้วยตนเอง ผู้ใช้ยังสามารถใช้เครื่องมือเพื่อกรองคลิปเสียงตามป้ายกำกับ ช่วยให้พวกเขาสามารถสร้างชุดข้อมูลป้ายกำกับที่แข็งแกร่งที่กำหนดเองซึ่งปรับให้เหมาะกับความต้องการเฉพาะของพวกเขา
AudioSet สามารถดาวน์โหลดได้จาก Google ที่นี่เป็นชุดไฟล์ CSV สำหรับแต่ละองค์ประกอบในชุดข้อมูล ไฟล์ CSV จะแสดงรหัส YouTube เวลาเริ่มต้น เวลาสิ้นสุด และป้ายกำกับคลาสที่เกี่ยวข้อง ไฟล์ CSV ใช้เพื่อดาวน์โหลด AudioSet เป็นไฟล์เสียงดิบ (WAV)
พื้นที่เก็บข้อมูลนี้มีวัตถุประสงค์เพื่อการศึกษาและการวิจัยเท่านั้น โปรดเคารพข้อกำหนดการใช้งานและข้อตกลงใบอนุญาตของ AudioSet เมื่อใช้เครื่องมือนี้