تنزيل pyAudioAnalysis - تنزيل كود مصدر pyAudioAnalysis

pyAudioAnalysis

بايثون

1.0.0

تنزيل

مكتبة بايثون لاستخراج ميزات الصوت وتصنيفها وتقسيمها وتطبيقاتها

هذه معلومات عامة. انقر هنا للحصول على الويكي الكامل وهنا للحصول على مقدمة أكثر عمومية لمعالجة البيانات الصوتية

أخبار

[2022-01-01] إذا لم تكن مهتمًا بتدريب النماذج الصوتية من بياناتك الخاصة، فيمكنك التحقق من Deep Audio API، حيث يمكنك إرسال البيانات الصوتية مباشرة وتلقي التنبؤات فيما يتعلق بالمحتوى الصوتي المعني (الكلام مقابل الصمت ، النوع الموسيقي، جنس المتحدث، الخ).
[2021-08-06] يتميز الصوت العميق بتصنيف صوتي عميق واستخراج الميزات باستخدام CNNs وPytorch
تحقق من paura وهو برنامج نصي بلغة Python لتسجيل البيانات الصوتية وتحليلها في الوقت الفعلي

عام

pyAudioAnalogy هي مكتبة Python تغطي مجموعة واسعة من مهام تحليل الصوت. من خلال pyAudioAnalogy يمكنك:

استخراج ميزات الصوت والتمثيلات (مثل mfccs، وspectrogram، وchromagram)
تدريب وضبط المعلمات وتقييم مصنفات المقاطع الصوتية
تصنيف الأصوات غير المعروفة
كشف الأحداث الصوتية واستبعاد فترات الصمت من التسجيلات الطويلة
إجراء تجزئة تحت الإشراف (تجزئة مشتركة - تصنيف)
قم بإجراء تجزئة غير خاضعة للرقابة (على سبيل المثال، تسجيل مكبر الصوت) واستخراج الصور المصغرة الصوتية
تدريب واستخدام نماذج الانحدار الصوتي (مثال للتطبيق: التعرف على المشاعر)
قم بتطبيق تقليل الأبعاد لتصور البيانات الصوتية وأوجه التشابه في المحتوى

تثبيت

استنساخ مصدر هذه المكتبة: git clone https://github.com/tyiannak/pyAudioAnalysis.git
تثبيت التبعيات: pip install -r ./requirements.txt
التثبيت باستخدام النقطة: pip install -e .

مثال لتصنيف الصوت

يمكن العثور على المزيد من الأمثلة والبرامج التعليمية التفصيلية على الويكي

يوفر pyAudioAnalogy أغلفة سهلة الاتصال لتنفيذ مهام تحليل الصوت. على سبيل المثال، يقوم هذا الكود أولاً بتدريب مصنف مقطع صوتي، مع إعطاء مجموعة من ملفات WAV المخزنة في مجلدات (يمثل كل مجلد فئة مختلفة) ثم يتم استخدام المصنف المدرب لتصنيف ملف WAV صوتي غير معروف

 from pyAudioAnalysis import audioTrainTest as aT
aT . extract_features_and_train ([ "classifierData/music" , "classifierData/speech" ], 1.0 , 1.0 , aT . shortTermWindow , aT . shortTermStep , "svm" , "svmSMtemp" , False )
aT . file_classification ( "data/doremi.wav" , "svmSMtemp" , "svm" )

النتيجة: (0.0، صفيف([ 0.90156761، 0.09843239])، ['موسيقى'، 'كلام'])

بالإضافة إلى ذلك، يتم توفير دعم سطر الأوامر لجميع الوظائف. على سبيل المثال، يستخرج الأمر التالي المخطط الطيفي للإشارة الصوتية المخزنة في ملف WAV: python audioAnalysis.py fileSpectrogram -i data/doremi.wav

مزيد من القراءة

بصرف النظر عن ملف README هذا، لفهم كيفية استخدام هذه المكتبة بشكل أفضل، يجب على المرء قراءة ما يلي:

أساسيات التعامل مع الصوت: معالجة الملفات الصوتية في سطر الأوامر أو Python، إذا كنت تريد معرفة كيفية التعامل مع الملفات الصوتية من سطر الأوامر، وبعض البرمجة الأساسية لمعالجة الإشارات الصوتية. ابدأ بذلك إذا كنت لا تعرف شيئًا عن الصوت.
مقدمة إلى تحليل الصوت: التعرف على الأصوات باستخدام التعلم الآلي هذا أعمق قليلاً من المقالة السابقة، من خلال توفير مقدمة كاملة لنظرية وممارسة استخراج ميزات الصوت وتصنيفها وتقسيمها (بما في ذلك العديد من أمثلة بايثون).
ويكي المكتبة
كيفية استخدام التعلم الآلي لتلوين الإضاءة الخاصة بك بناءً على الحالة المزاجية للموسيقى حالة استخدام مثيرة للاهتمام لاستخدام هذا lib لتدريب مُقدِّر مزاج الموسيقى في الوقت الفعلي.
ويرد في هذا المنشور وصف أكثر عمومية ونظرية للأساليب المعتمدة (إلى جانب العديد من التجارب على حالات استخدام معينة). الرجاء استخدام الاقتباس التالي عند الاستشهاد بـ pyAudioAnalogy في عملك البحثي :

@ article { giannakopoulos2015pyaudioanalysis ,
  title = { pyAudioAnalysis : An Open - Source Python Library for Audio Signal Analysis },
  author = { Giannakopoulos , Theodoros },
  journal = { PloS one },
  volume = { 10 },
  number = { 12 },
  year = { 2015 },
  publisher = { Public Library of Science }
}

للاطلاع على مواد التحليل الصوتي المتعلقة بـ Matlab، راجع هذا الكتاب.

مؤلف

ثيودوروس جياناكوبولوس، باحث رئيسي في التعلم الآلي متعدد الوسائط في مجموعة تحليل الوسائط المتعددة في مختبر الذكاء الحسابي (MagCIL) التابع لمعهد المعلوماتية والاتصالات التابع للمركز الوطني للبحث العلمي "ديموكريتوس"

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع بايثون
وقت التحديث 2024-12-30
الحجم 84.84MB
من Github

تطبيقات ذات صلة

Google Blog Converters (محول بيانات المدونة)

2009-05-24
Nuitka

2024-12-14
منصة تصور البيانات SmartChart v6.9

2024-11-27
azure storage python

2024-12-15
Redash أداة مخطط البيانات مفتوحة المصدر v24.10.0

2024-11-27
datamule python

2024-11-08

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Blog Converters (محول بيانات المدونة)

بايثون

1.0 R54
Nuitka

بايثون

1.0.0
منصة تصور البيانات SmartChart v6.9

بايثون

6.9
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
termwind

فئات أخرى

v2.3.0
wp functions

فئات أخرى

1.0.0

أخبار ذات صلة الكل