これは一般的な情報です。完全な Wiki についてはここをクリックし、音声データ処理のより一般的な概要についてはここをクリックしてください
pyAudioAnalysis は、幅広いオーディオ分析タスクをカバーする Python ライブラリです。 pyAudioAnalysis を通じて、次のことが可能になります。
git clone https://github.com/tyiannak/pyAudioAnalysis.git
pip install -r ./requirements.txt
pip install -e .
より多くの例と詳細なチュートリアルは wiki にあります。
pyAudioAnalysis は、オーディオ分析タスクを実行するための簡単に呼び出せるラッパーを提供します。たとえば、このコードは、フォルダー (各フォルダーが異なるクラスを表す) に保存されている一連の WAV ファイルを指定して、最初にオーディオ セグメント分類子をトレーニングし、次にトレーニングされた分類子を使用して未知のオーディオ WAV ファイルを分類します。
from pyAudioAnalysis import audioTrainTest as aT
aT . extract_features_and_train ([ "classifierData/music" , "classifierData/speech" ], 1.0 , 1.0 , aT . shortTermWindow , aT . shortTermStep , "svm" , "svmSMtemp" , False )
aT . file_classification ( "data/doremi.wav" , "svmSMtemp" , "svm" )
結果: (0.0, array([ 0.90156761, 0.09843239]), ['音楽', 'スピーチ'])
さらに、すべての機能に対してコマンド ラインのサポートが提供されます。たとえば、次のコマンドは、WAV ファイルに保存されているオーディオ信号のスペクトログラムを抽出します。 python audioAnalysis.py fileSpectrogram -i data/doremi.wav
このライブラリの使用方法をよりよく理解するには、この README ファイルとは別に、以下を読む必要があります。
@ article { giannakopoulos2015pyaudioanalysis ,
title = { pyAudioAnalysis : An Open - Source Python Library for Audio Signal Analysis },
author = { Giannakopoulos , Theodoros },
journal = { PloS one },
volume = { 10 },
number = { 12 },
year = { 2015 },
publisher = { Public Library of Science }
}
Matlab 関連の音声解析資料については、この本を確認してください。
Theodoros Giannakopoulos 氏、国立科学研究センター「デモクリトス」、情報学通信研究所計算知能研究室 (MagCIL) マルチメディア分析グループのマルチモーダル機械学習主任研究員