WebSpeechRecognition ist eine Python-Bibliothek, die dabei hilft, Sprache in Echtzeit in Text umzuwandeln. Es verwendet den Selenium WebDriver und die HTML5 Web Speech API. Dieses Tool wurde für die Zusammenarbeit mit Chrome WebDriver entwickelt und ist einfach für Spracherkennungsaufgaben zu verwenden.
Um WebSpeechRecognition zu installieren, können Sie pip verwenden:
pip install WebSpeechRecognition
Um WebSpeechRecognition zu verwenden, initialisieren Sie die SpeechRecognition
-Klasse mit dem Pfad zu Ihrer ausführbaren ChromeDriver-Datei und dem Sprachcode:
from WebSpeechRecognition import SpeechRecognition
recognizer = SpeechRecognition ( "path/to/chromedriver" , language = "en-US" )
recognizer . Init ()
Um mit dem Zuhören und Transkribieren von Sprache zu beginnen, verwenden Sie die Methode Listen
. Diese Methode gibt den transkribierten Text zurück:
text = recognizer . Listen ( print_allowed = True )
print ( f"You said: { text } " )
Wenn Sie fertig sind, verwenden Sie die Quit
-Methode, um die ChromeDriver-Instanz zu schließen:
recognizer . Quit ()
Hier ist ein vollständiges Beispiel:
from WebSpeechRecognition import SpeechRecognition
recognizer = SpeechRecognition ( "path/to/chromedriver" , language = "en-US" )
recognizer . Init ()
while True :
try :
text = recognizer . Listen ( print_allowed = True )
print ( f"You said: { text } " )
except KeyboardInterrupt :
recognizer . Quit ()
break
SpeechRecognition(driver_path, language)
driver_path
: Der Pfad zur Chrome WebDriver-Datei.language
: Der Sprachcode für die Erkennung (Standard: „en-US“).Init()
Richtet den WebDriver mit Optionen für die Spracherkennung ein.
Listen(print_allowed=False)
Beginnt mit dem Zuhören und gibt den gehörten Text zurück.
print_allowed
: Wenn True, wird erkannter Text auf der Konsole gedruckt.Quit()
Stoppt den WebDriver und schließt alles.
Wir freuen uns über Beiträge! Wenn Sie einen Fehler finden oder eine Idee für eine neue Funktion haben, können Sie gerne ein Issue oder eine Pull-Anfrage in unserem GitHub-Repository eröffnen.
Möchten Sie zur Verbesserung der Spracherkennung beitragen? So geht's:
git checkout -b feature-branch
).git commit -m 'Add feature'
).git push origin feature-branch
). Dieses Projekt verwendet die MIT-Lizenz. Einzelheiten finden Sie in der LICENSE
Datei.
Haben Sie Fragen oder Anregungen? Kontaktieren Sie uns: