WebSpeechRecognition é uma biblioteca Python que ajuda a transformar fala em texto em tempo real. Ele usa o Selenium WebDriver e a API HTML5 Web Speech. Esta ferramenta foi desenvolvida para funcionar com o Chrome WebDriver e é fácil de usar para tarefas de reconhecimento de fala.
Para instalar WebSpeechRecognition , você pode usar pip:
pip install WebSpeechRecognition
Para começar a usar WebSpeechRecognition , inicialize a classe SpeechRecognition
com o caminho para o executável do ChromeDriver e o código do idioma:
from WebSpeechRecognition import SpeechRecognition
recognizer = SpeechRecognition ( "path/to/chromedriver" , language = "en-US" )
recognizer . Init ()
Para começar a ouvir e transcrever a fala, use o método Listen
. Este método retorna o texto transcrito:
text = recognizer . Listen ( print_allowed = True )
print ( f"You said: { text } " )
Quando terminar, use o método Quit
para fechar a instância do ChromeDriver:
recognizer . Quit ()
Aqui está um exemplo completo:
from WebSpeechRecognition import SpeechRecognition
recognizer = SpeechRecognition ( "path/to/chromedriver" , language = "en-US" )
recognizer . Init ()
while True :
try :
text = recognizer . Listen ( print_allowed = True )
print ( f"You said: { text } " )
except KeyboardInterrupt :
recognizer . Quit ()
break
SpeechRecognition(driver_path, language)
driver_path
: o caminho para o arquivo Chrome WebDriver.language
: O código do idioma para reconhecimento (padrão: "en-US").Init()
Configura o WebDriver com opções de reconhecimento de fala.
Listen(print_allowed=False)
Começa a ouvir e retorna o texto que ouve.
print_allowed
: Se True, imprime o texto reconhecido no console.Quit()
Para o WebDriver e fecha tudo.
Aceitamos contribuições! Se você encontrar um bug ou tiver uma ideia para um novo recurso, sinta-se à vontade para abrir um problema ou uma solicitação pull em nosso repositório GitHub.
Quer ajudar a melhorar o SpeechRecognition? Veja como:
git checkout -b feature-branch
).git commit -m 'Add feature'
).git push origin feature-branch
). Este projeto usa a licença MIT. Consulte o arquivo LICENSE
para obter detalhes.
Tem dúvidas ou sugestões? Contate-nos: