pyAudioAnalysisダウンロード - pyAudioAnalysisソースコードのダウンロード

pyAudioAnalysis

パイソン

1.0.0

ダウンロード

オーディオ特徴の抽出、分類、セグメンテーション、およびアプリケーションのための Python ライブラリ

これは一般的な情報です。完全な Wiki についてはここをクリックし、音声データ処理のより一般的な概要についてはここをクリックしてください

ニュース

[2022-01-01] 独自のデータからオーディオモデルをトレーニングすることに興味がない場合は、Deep Audio API を確認して、オーディオデータを直接送信して、それぞれのオーディオコンテンツ (音声と沈黙) に関する予測を受け取ることができます。、音楽ジャンル、話者の性別など）。
[2021-08-06] deep-audio-features CNN と Pytorch を使用したディープオーディオ分類と特徴抽出
音声データのリアルタイム録音と分析のための Python スクリプト paura を確認してください。

一般的な

pyAudioAnalysis は、幅広いオーディオ分析タスクをカバーする Python ライブラリです。 pyAudioAnalysis を通じて、次のことが可能になります。

オーディオの特徴と表現を抽出します (例: mfccs、スペクトログラム、クロマグラム)
オーディオセグメントの分類器をトレーニング、パラメータ調整、評価します
未知の音を分類する
音声イベントを検出し、長時間の録音から無音期間を除外します
教師付きセグメンテーションの実行 (結合セグメンテーション - 分類)
教師なしセグメンテーション(話者ダイアライゼーションなど) を実行し、オーディオのサムネイルを抽出します。
音声回帰モデルをトレーニングして使用する (アプリケーション例: 感情認識)
次元削減を適用してオーディオデータとコンテンツの類似性を視覚化する

インストール

このライブラリのソースのクローンを作成します: git clone https://github.com/tyiannak/pyAudioAnalysis.git
依存関係をインストールします: pip install -r ./requirements.txt
pip を使用してインストールします: pip install -e .

音声分類の例

より多くの例と詳細なチュートリアルは wiki にあります。

pyAudioAnalysis は、オーディオ分析タスクを実行するための簡単に呼び出せるラッパーを提供します。たとえば、このコードは、フォルダー (各フォルダーが異なるクラスを表す) に保存されている一連の WAV ファイルを指定して、最初にオーディオセグメント分類子をトレーニングし、次にトレーニングされた分類子を使用して未知のオーディオ WAV ファイルを分類します。

 from pyAudioAnalysis import audioTrainTest as aT
aT . extract_features_and_train ([ "classifierData/music" , "classifierData/speech" ], 1.0 , 1.0 , aT . shortTermWindow , aT . shortTermStep , "svm" , "svmSMtemp" , False )
aT . file_classification ( "data/doremi.wav" , "svmSMtemp" , "svm" )

結果: (0.0, array([ 0.90156761, 0.09843239]), ['音楽', 'スピーチ'])

さらに、すべての機能に対してコマンドラインのサポートが提供されます。たとえば、次のコマンドは、WAV ファイルに保存されているオーディオ信号のスペクトログラムを抽出します。 python audioAnalysis.py fileSpectrogram -i data/doremi.wav

さらに読む

このライブラリの使用方法をよりよく理解するには、この README ファイルとは別に、以下を読む必要があります。

オーディオ処理の基本: コマンドラインまたは Python でオーディオファイルを処理する (コマンドラインからオーディオファイルを処理する方法と、オーディオ信号処理に関する基本的なプログラミングを学習したい場合)。オーディオについて何も知らない場合は、そこから始めてください。
オーディオ分析の紹介: 機械学習を使用した音の認識これは、オーディオ特徴の抽出、分類、セグメンテーションの理論と実践への完全な入門を提供することで、前の記事よりも少し深くなります (多くの Python の例が含まれています)。
図書館のウィキ
機械学習を使用して音楽の雰囲気に基づいて照明に色を付ける方法。このライブラリを使用してリアルタイムの音楽ムード推定器をトレーニングする興味深い使用例です。
この出版物には、採用された方法のより一般的かつ理論的な説明が (特定の使用例に関するいくつかの実験とともに) 示されています。研究活動で pyAudioAnalysis を引用する場合は、次の引用を使用してください。

@ article { giannakopoulos2015pyaudioanalysis ,
  title = { pyAudioAnalysis : An Open - Source Python Library for Audio Signal Analysis },
  author = { Giannakopoulos , Theodoros },
  journal = { PloS one },
  volume = { 10 },
  number = { 12 },
  year = { 2015 },
  publisher = { Public Library of Science }
}