WebSpeechRecognition
1.0.0
WebSpeechRecognitionは、音声をリアルタイムでテキストに変換するのに役立つ Python ライブラリです。 Selenium WebDriver と HTML5 Web Speech API を使用します。このツールは Chrome WebDriver と連携するように構築されており、音声認識タスクに簡単に使用できます。
WebSpeechRecognitionをインストールするには、 pip を使用できます。
pip install WebSpeechRecognition
WebSpeechRecognitionの使用を開始するには、ChromeDriver 実行可能ファイルへのパスと言語コードを使用してSpeechRecognition
クラスを初期化します。
from WebSpeechRecognition import SpeechRecognition
recognizer = SpeechRecognition ( "path/to/chromedriver" , language = "en-US" )
recognizer . Init ()
音声の聞き取りと文字起こしを開始するには、 Listen
メソッドを使用します。このメソッドは、転写されたテキストを返します。
text = recognizer . Listen ( print_allowed = True )
print ( f"You said: { text } " )
完了したら、 Quit
メソッドを使用して ChromeDriver インスタンスを閉じます。
recognizer . Quit ()
完全な例を次に示します。
from WebSpeechRecognition import SpeechRecognition
recognizer = SpeechRecognition ( "path/to/chromedriver" , language = "en-US" )
recognizer . Init ()
while True :
try :
text = recognizer . Listen ( print_allowed = True )
print ( f"You said: { text } " )
except KeyboardInterrupt :
recognizer . Quit ()
break
SpeechRecognition(driver_path, language)
driver_path
: Chrome WebDriver ファイルへのパス。language
: 認識用の言語コード (デフォルト: "en-US")。Init()
音声認識のオプションを使用して WebDriver をセットアップします。
Listen(print_allowed=False)
リスニングを開始し、聞いたテキストを返します。
print_allowed
: True の場合、認識されたテキストをコンソールに出力します。Quit()
WebDriver を停止し、すべてを閉じます。
寄付を歓迎します!バグを見つけた場合、または新機能のアイデアがある場合は、お気軽に GitHub リポジトリで問題またはプル リクエストを開いてください。
音声認識の改善に貢献したいですか?その方法は次のとおりです。
git checkout -b feature-branch
)。git commit -m 'Add feature'
)。git push origin feature-branch
)。このプロジェクトは MIT ライセンスを使用します。詳細については、 LICENSE
ファイルを参照してください。
ご質問やご提案がありますか?お問い合わせ: