WebSpeechRecognition — это библиотека Python, которая помогает превращать речь в текст в реальном времени. Он использует Selenium WebDriver и API HTML5 Web Speech. Этот инструмент создан для работы с Chrome WebDriver и прост в использовании для задач распознавания речи.
Чтобы установить WebSpeechRecognition , вы можете использовать pip:
pip install WebSpeechRecognition
Чтобы начать использовать WebSpeechRecognition , инициализируйте класс SpeechRecognition
, указав путь к исполняемому файлу ChromeDriver и код языка:
from WebSpeechRecognition import SpeechRecognition
recognizer = SpeechRecognition ( "path/to/chromedriver" , language = "en-US" )
recognizer . Init ()
Чтобы начать прослушивание и расшифровку речи, используйте метод Listen
. Этот метод возвращает транскрибированный текст:
text = recognizer . Listen ( print_allowed = True )
print ( f"You said: { text } " )
Когда вы закончите, используйте метод Quit
, чтобы закрыть экземпляр ChromeDriver:
recognizer . Quit ()
Вот полный пример:
from WebSpeechRecognition import SpeechRecognition
recognizer = SpeechRecognition ( "path/to/chromedriver" , language = "en-US" )
recognizer . Init ()
while True :
try :
text = recognizer . Listen ( print_allowed = True )
print ( f"You said: { text } " )
except KeyboardInterrupt :
recognizer . Quit ()
break
SpeechRecognition(driver_path, language)
driver_path
: путь к файлу Chrome WebDriver.language
: код языка для распознавания (по умолчанию: «en-US»).Init()
Настраивает WebDriver с параметрами распознавания речи.
Listen(print_allowed=False)
Начинает прослушивание и возвращает услышанный текст.
print_allowed
: если True, распознанный текст выводится на консоль.Quit()
Останавливает WebDriver и закрывает все.
Мы приветствуем вклады! Если вы обнаружили ошибку или у вас есть идея для новой функции, смело открывайте проблему или запрос на включение в нашем репозитории GitHub.
Хотите помочь улучшить распознавание речи? Вот как:
git checkout -b feature-branch
).git commit -m 'Add feature'
).git push origin feature-branch
). Этот проект использует лицензию MIT. Подробности смотрите в файле LICENSE
.
Есть вопросы или предложения? Связаться с нами: