pyAudioAnalysis下載 - pyAudioAnalysis原始碼下載

pyAudioAnalysis

Python

1.0.0

下載

用於音訊特徵提取、分類、分割和應用的 Python 庫

這是一般資訊。點擊此處查看完整的 wiki，點擊此處查看音訊資料處理的更通用介紹

訊息

[2022-01-01] 如果您對根據自己的資料訓練音訊模型不感興趣，您可以檢查 Deep Audio API，您是否可以直接發送音訊資料並接收有關相應音訊內容（語音與靜音）的預測、音樂流派、說話者性別等）。
[2021-08-06] Deep-audio-features 使用 CNN 和 Pytorch 進行深度音訊分類和特徵提取
查看 paura 一個用於即時錄製和分析音訊資料的 Python 腳本

一般的

pyAudioAnalysis 是一個涵蓋廣泛音訊分析任務的 Python 函式庫。透過 pyAudioAnalysis 您可以：

提取音頻特徵和表示（例如 mfcc、頻譜圖、色譜圖）
訓練、參數調整和評估音訊片段的分類器
對未知聲音進行分類
偵測音訊事件並排除長錄音中的靜音期
執行監督分割（聯合分割-分類）
執行無監督分割（例如說話者二值化）並提取音訊縮圖
訓練和使用音訊迴歸模型（範例應用：情緒辨識）
應用降維來視覺化音訊資料和內容相似性

安裝

複製該函式庫的原始碼： git clone https://github.com/tyiannak/pyAudioAnalysis.git
安裝依賴項： pip install -r ./requirements.txt
使用 pip 安裝： pip install -e .

音訊分類範例

更多範例和詳細教學可以在 wiki 中找到

pyAudioAnalysis 提供易於呼叫的包裝器來執行音訊分析任務。例如，此程式碼首先訓練音訊片段分類器，給定儲存在資料夾中的一組 WAV 檔案（每個資料夾代表不同的類別），然後使用訓練好的分類器對未知音訊 WAV 檔案進行分類

 from pyAudioAnalysis import audioTrainTest as aT
aT . extract_features_and_train ([ "classifierData/music" , "classifierData/speech" ], 1.0 , 1.0 , aT . shortTermWindow , aT . shortTermStep , "svm" , "svmSMtemp" , False )
aT . file_classification ( "data/doremi.wav" , "svmSMtemp" , "svm" )

結果：(0.0, array([ 0.90156761, 0.09843239]), ['音樂', '語音'])

此外，也為所有功能提供命令列支援。例如，以下命令提取儲存在 WAV 檔案中的音訊訊號的頻譜圖： python audioAnalysis.py fileSpectrogram -i data/doremi.wav

進一步閱讀

除了這個自述文件之外，為了更好地理解如何使用這個庫，還應該閱讀以下內容：

音訊處理基礎知識：在命令列或 Python 中處理音訊文件，如果您想學習如何從命令列處理音訊文件，以及一些有關音訊訊號處理的基本程式設計。如果您對音訊一無所知，請從這裡開始。
音訊分析簡介：使用機器學習識別聲音這篇文章比前一篇文章更深入一些，提供了音訊特徵提取、分類和分割的理論和實踐的完整介紹（包括許多 Python 範例）。
圖書館的維基百科
如何使用機器學習根據音樂情緒為燈光著色。使用此庫來訓練即時音樂情緒估計器的一個有趣的用例。
本出版物對所採用的方法（以及針對特定用例的一些實驗）進行了更一般性和理論性的描述。在您的研究工作中引用 pyAudioAnalysis 時，請使用以下引用：

@ article { giannakopoulos2015pyaudioanalysis ,
  title = { pyAudioAnalysis : An Open - Source Python Library for Audio Signal Analysis },
  author = { Giannakopoulos , Theodoros },
  journal = { PloS one },
  volume = { 10 },
  number = { 12 },
  year = { 2015 },
  publisher = { Public Library of Science }
}