pyAudioAnalysis
1.0.0
這是一般資訊。點擊此處查看完整的 wiki,點擊此處查看音訊資料處理的更通用介紹
pyAudioAnalysis 是一個涵蓋廣泛音訊分析任務的 Python 函式庫。透過 pyAudioAnalysis 您可以:
git clone https://github.com/tyiannak/pyAudioAnalysis.git
pip install -r ./requirements.txt
pip install -e .
更多範例和詳細教學可以在 wiki 中找到
pyAudioAnalysis 提供易於呼叫的包裝器來執行音訊分析任務。例如,此程式碼首先訓練音訊片段分類器,給定儲存在資料夾中的一組 WAV 檔案(每個資料夾代表不同的類別),然後使用訓練好的分類器對未知音訊 WAV 檔案進行分類
from pyAudioAnalysis import audioTrainTest as aT
aT . extract_features_and_train ([ "classifierData/music" , "classifierData/speech" ], 1.0 , 1.0 , aT . shortTermWindow , aT . shortTermStep , "svm" , "svmSMtemp" , False )
aT . file_classification ( "data/doremi.wav" , "svmSMtemp" , "svm" )
結果:(0.0, array([ 0.90156761, 0.09843239]), ['音樂', '語音'])
此外,也為所有功能提供命令列支援。例如,以下命令提取儲存在 WAV 檔案中的音訊訊號的頻譜圖: python audioAnalysis.py fileSpectrogram -i data/doremi.wav
除了這個自述文件之外,為了更好地理解如何使用這個庫,還應該閱讀以下內容:
@ article { giannakopoulos2015pyaudioanalysis ,
title = { pyAudioAnalysis : An Open - Source Python Library for Audio Signal Analysis },
author = { Giannakopoulos , Theodoros },
journal = { PloS one },
volume = { 10 },
number = { 12 },
year = { 2015 },
publisher = { Public Library of Science }
}
有關 Matlab 相關音訊分析資料請查看本書。
Theodoros Giannakopoulos,國家科學研究中心「Demokritos」資訊學與電信研究所計算智慧實驗室 (MagCIL) 多媒體分析組多模態機器學習首席研究員