vosk api
v0.3.50
Vosk 是一个离线开源语音识别工具包。它支持 20 多种语言和方言的语音识别 - 英语、印度英语、德语、法语、西班牙语、葡萄牙语、中文、俄语、土耳其语、越南语、意大利语、荷兰语、加泰罗尼亚语、阿拉伯语、希腊语、波斯语、菲律宾语、乌克兰语、哈萨克语、瑞典语、日语、世界语、印地语、捷克语、波兰语。未来还会有更多。
Vosk 模型很小 (50 Mb),但提供连续的大词汇转录、带流 API 的零延迟响应、可重新配置的词汇和说话人识别。
为各种编程语言(如 Python、Java、Node.JS、C#、C++、Rust、Go 等)实现的语音识别绑定。
Vosk 为聊天机器人、智能家电、虚拟助理提供语音识别。它还可以为电影创建字幕、讲座和采访的转录。
Vosk 可从 Raspberry Pi 或 Android 智能手机等小型设备扩展到大型集群。
有关安装说明、示例和文档,请访问 Vosk 网站。