يوفر هذا المستودع أداة لتنزيل مقاطع صوتية قوية من AudioSet، وهي مجموعة بيانات واسعة النطاق للأحداث الصوتية المشروحة. يمكن استخدام الأداة لإنشاء مجموعات بيانات صوتية مخصصة قوية لمهام التعلم الآلي.
قم بتنزيل الملفات الصوتية بكفاءة من AudioSet بناءً على تسميات محددة.
يدعم التنزيلات المتوازية المتعددة لتسريع العملية.
المرونة في اختيار عدد الملفات الصوتية المراد تنزيلها لكل ملصق.
نظام تسجيل مناسب لتتبع عملية التنزيل.
يمكن إجراء تكوين عملية التنزيل من خلال ملف config.yaml
.
بيثون3
ffmpeg
يوتيوب-دل
استنساخ هذا المستودع:
استنساخ بوابة https://github.com/your-username/audioset-downloader.git
تثبيت التبعيات:
تثبيت النقطة -r متطلبات.txt
قم بتشغيل البرنامج النصي input_label.py
لإنشاء قاموس التسمية:
بيثون input_label.py
افتح ملف config.yaml والصق قاموس التسمية الذي تم إنشاؤه في الخطوة السابقة. قم بتعديل الحقول الأخرى في الملف حسب الرغبة.
قم بتشغيل البرنامج النصي main.py لتنزيل المقاطع الصوتية: يقوم بتنزيل الملفات الصوتية إلى مجلد output/dataset
في الدليل الحالي.
بيثون main.py
يستخدم ملفات CSV الموجودة في core/
بشكل افتراضي. قم بتنفيذ main.py
في الدليل الخاص به.
يتم تحديد تكوين الأداة في ملف config.yaml. الحقول التالية متاحة:
labels
: قائمة التسميات المراد تنزيلها.
labels_id_dict
: تسميات تعيين القاموس لمعرفات AudioSet.
csv_dataset
: المسار إلى مجموعة بيانات CSV.
workspace
: دليل مساحة العمل.
destination_dir
: دليل الوجهة للملفات الصوتية التي تم تنزيلها.
fs
: تردد أخذ العينات.
eval_rate
: معدل التقييم.
num_threads
: عدد المواضيع التي سيتم استخدامها عند التنزيل.
بالضبط، لهذا السبب هناك حاجة إلى برنامج تنزيل لـ AudioSet. تحتوي ملفات CSV التي توفرها AudioSet على معلومات حول معرفات YouTube والتسميات المرتبطة بها فقط، ولكن ليس البيانات الصوتية الفعلية. من ناحية أخرى، تحتوي ملفات TFRecord على متجهات الميزات، ولكن ليس الإشارات الصوتية الأولية المطلوبة لبعض مهام التعلم الآلي.
باستخدام أداة التنزيل، يمكن للمستخدمين تنزيل البيانات الصوتية بتنسيق أولي واستخدامها لتدريب نماذجهم. يمكن أن تساعد هذه الأداة في توفير الوقت والجهد، حيث لا يتعين على المستخدم البحث يدويًا عن كل مقطع صوتي فردي وتنزيله من YouTube. يمكن للمستخدم أيضًا استخدام الأداة لتصفية المقاطع الصوتية بناءً على تسمياتها، مما يسمح له ببناء مجموعة بيانات مخصصة قوية مصممة خصيصًا لتلبية احتياجاته الخاصة.
يمكن تنزيل AudioSet من Google هنا كمجموعة من ملفات CSV. بالنسبة لكل عنصر في مجموعة البيانات، تدرج ملفات CSV معرف YouTube المرتبط ووقت البدء ووقت الانتهاء وتسميات الفصل الدراسي. تُستخدم ملفات CSV لتنزيل AudioSet كملفات صوتية خام (WAV).
هذا المستودع للأغراض التعليمية والبحثية فقط. يرجى احترام شروط الاستخدام واتفاقيات الترخيص الخاصة بـ AudioSet عند استخدام هذه الأداة.