pyAudioAnalysis
1.0.0
这是一般信息。单击此处查看完整的 wiki,单击此处查看音频数据处理的更通用介绍
pyAudioAnalysis 是一个涵盖广泛音频分析任务的 Python 库。通过 pyAudioAnalysis 您可以:
git clone https://github.com/tyiannak/pyAudioAnalysis.git
pip install -r ./requirements.txt
pip install -e .
更多示例和详细教程可以在 wiki 中找到
pyAudioAnalysis 提供易于调用的包装器来执行音频分析任务。例如,此代码首先训练音频片段分类器,给定存储在文件夹中的一组 WAV 文件(每个文件夹代表不同的类),然后使用训练好的分类器对未知音频 WAV 文件进行分类
from pyAudioAnalysis import audioTrainTest as aT
aT . extract_features_and_train ([ "classifierData/music" , "classifierData/speech" ], 1.0 , 1.0 , aT . shortTermWindow , aT . shortTermStep , "svm" , "svmSMtemp" , False )
aT . file_classification ( "data/doremi.wav" , "svmSMtemp" , "svm" )
结果:(0.0, array([ 0.90156761, 0.09843239]), ['音乐', '语音'])
此外,还为所有功能提供命令行支持。例如,以下命令提取存储在 WAV 文件中的音频信号的频谱图: python audioAnalysis.py fileSpectrogram -i data/doremi.wav
除了这个自述文件之外,为了更好地理解如何使用这个库,还应该阅读以下内容:
@ article { giannakopoulos2015pyaudioanalysis ,
title = { pyAudioAnalysis : An Open - Source Python Library for Audio Signal Analysis },
author = { Giannakopoulos , Theodoros },
journal = { PloS one },
volume = { 10 },
number = { 12 },
year = { 2015 },
publisher = { Public Library of Science }
}
有关 Matlab 相关音频分析材料请查看本书。
Theodoros Giannakopoulos,国家科学研究中心“Demokritos”信息学与电信研究所计算智能实验室 (MagCIL) 多媒体分析组多模态机器学习首席研究员