Vosk es un conjunto de herramientas de reconocimiento de voz de código abierto y sin conexión. Permite el reconocimiento de voz para más de 20 idiomas y dialectos: inglés, inglés indio, alemán, francés, español, portugués, chino, ruso, turco, vietnamita, italiano, holandés, catalán, árabe, griego, farsi, filipino, ucraniano, kazajo. Sueco, japonés, esperanto, hindi, checo, polaco. Más por venir.
Los modelos Vosk son pequeños (50 Mb) pero proporcionan transcripción continua de vocabulario extenso, respuesta de latencia cero con API de transmisión, vocabulario reconfigurable e identificación de hablante.
Enlaces de reconocimiento de voz implementados para varios lenguajes de programación como Python, Java, Node.JS, C#, C++, Rust, Go y otros.
Vosk proporciona reconocimiento de voz para chatbots, electrodomésticos inteligentes y asistentes virtuales. También puede crear subtítulos para películas, transcripciones para conferencias y entrevistas.
Vosk escala desde dispositivos pequeños como Raspberry Pi o teléfonos inteligentes Android hasta grandes clústeres.
Para obtener instrucciones de instalación, ejemplos y documentación, visite el sitio web de Vosk.