Vosk é um kit de ferramentas de reconhecimento de fala offline de código aberto. Permite o reconhecimento de voz para mais de 20 idiomas e dialetos - inglês, inglês indiano, alemão, francês, espanhol, português, chinês, russo, turco, vietnamita, italiano, holandês, catalão, árabe, grego, farsi, filipino, ucraniano, cazaque, Sueco, Japonês, Esperanto, Hindi, Tcheco, Polonês. Mais por vir.
Os modelos Vosk são pequenos (50 Mb), mas fornecem transcrição contínua de vocabulário grande, resposta de latência zero com API de streaming, vocabulário reconfigurável e identificação de locutor.
Ligações de reconhecimento de fala implementadas para várias linguagens de programação como Python, Java, Node.JS, C#, C++, Rust, Go e outras.
A Vosk fornece reconhecimento de fala para chatbots, eletrodomésticos inteligentes e assistentes virtuais. Também pode criar legendas para filmes, transcrições para palestras e entrevistas.
Vosk pode ser dimensionado desde pequenos dispositivos como Raspberry Pi ou smartphone Android até grandes clusters.
Para obter instruções de instalação, exemplos e documentação, visite o site da Vosk.