vosk api
v0.3.50
Vosk는 오프라인 오픈 소스 음성 인식 툴킷입니다. 영어, 인도 영어, 독일어, 프랑스어, 스페인어, 포르투갈어, 중국어, 러시아어, 터키어, 베트남어, 이탈리아어, 네덜란드어, 카탈로니아어, 아랍어, 그리스어, 페르시아어, 필리핀어, 우크라이나어, 카자흐어 등 20개 이상의 언어 및 방언에 대한 음성 인식이 가능합니다. 스웨덴어, 일본어, 에스페란토, 힌디어, 체코어, 폴란드어. 더 많은 기능이 제공됩니다.
Vosk 모델은 작지만(50Mb) 연속적인 대규모 어휘 전사, 스트리밍 API를 통한 지연 시간 없는 응답, 재구성 가능한 어휘 및 화자 식별을 제공합니다.
Python, Java, Node.JS, C#, C++, Rust, Go 등과 같은 다양한 프로그래밍 언어에 대해 구현된 음성 인식 바인딩입니다.
Vosk는 챗봇, 스마트 가전제품, 가상 비서에 음성 인식 기능을 제공합니다. 또한 영화 자막, 강의 및 인터뷰 전사본을 만들 수도 있습니다.
Vosk는 Raspberry Pi 또는 Android 스마트폰과 같은 소형 장치부터 대규모 클러스터까지 확장됩니다.
설치 지침, 예제 및 문서를 보려면 Vosk 웹사이트를 방문하세요.