vosk api
v0.3.50
Vosk は、オフラインのオープンソース音声認識ツールキットです。 20 以上の言語と方言 - 英語、インド英語、ドイツ語、フランス語、スペイン語、ポルトガル語、中国語、ロシア語、トルコ語、ベトナム語、イタリア語、オランダ語、カタロニア語、アラビア語、ギリシャ語、ペルシア語、フィリピン語、ウクライナ語、カザフ語、スウェーデン語、日本語、エスペラント語、ヒンディー語、チェコ語、ポーランド語。今後も続きます。
Vosk モデルは小規模 (50 Mb) ですが、大量の語彙の継続的な文字起こし、ストリーミング API による遅延ゼロの応答、再構成可能な語彙、話者識別を提供します。
Python、Java、Node.JS、C#、C++、Rust、Go などのさまざまなプログラミング言語用に実装された音声認識バインディング。
Vosk は、チャットボット、スマート家電、仮想アシスタント向けの音声認識を提供しています。映画の字幕、講演やインタビューの文字起こしも作成できます。
Vosk は、Raspberry Pi や Android スマートフォンなどの小型デバイスから大規模なクラスターまで拡張します。
インストール手順、例、ドキュメントについては、Vosk Web サイトにアクセスしてください。