WebSpeechRecognition adalah pustaka Python yang membantu mengubah ucapan menjadi teks secara real-time. Ia menggunakan Selenium WebDriver dan HTML5 Web Speech API. Alat ini dibuat untuk bekerja dengan Chrome WebDriver dan mudah digunakan untuk tugas pengenalan suara.
Untuk menginstal WebSpeechRecognition , Anda dapat menggunakan pip:
pip install WebSpeechRecognition
Untuk mulai menggunakan WebSpeechRecognition , inisialisasi kelas SpeechRecognition
dengan jalur ke ChromeDriver yang dapat dieksekusi dan kode bahasa:
from WebSpeechRecognition import SpeechRecognition
recognizer = SpeechRecognition ( "path/to/chromedriver" , language = "en-US" )
recognizer . Init ()
Untuk mulai mendengarkan dan menyalin ucapan, gunakan metode Listen
. Metode ini mengembalikan teks yang ditranskripsi:
text = recognizer . Listen ( print_allowed = True )
print ( f"You said: { text } " )
Setelah selesai, gunakan metode Quit
untuk menutup instance ChromeDriver:
recognizer . Quit ()
Berikut ini contoh lengkapnya:
from WebSpeechRecognition import SpeechRecognition
recognizer = SpeechRecognition ( "path/to/chromedriver" , language = "en-US" )
recognizer . Init ()
while True :
try :
text = recognizer . Listen ( print_allowed = True )
print ( f"You said: { text } " )
except KeyboardInterrupt :
recognizer . Quit ()
break
SpeechRecognition(driver_path, language)
driver_path
: Jalur ke file Chrome WebDriver.language
: Kode bahasa untuk pengenalan (default: "en-US").Init()
Menyiapkan WebDriver dengan opsi pengenalan suara.
Listen(print_allowed=False)
Mulai mendengarkan dan mengembalikan teks yang didengarnya.
print_allowed
: Jika Benar, mencetak teks yang dikenali ke konsol.Quit()
Menghentikan WebDriver dan menutup semuanya.
Kami menyambut kontribusi! Jika Anda menemukan bug atau mempunyai ide untuk fitur baru, silakan buka masalah atau permintaan tarik di repositori GitHub kami.
Ingin membantu meningkatkan SpeechRecognition? Begini caranya:
git checkout -b feature-branch
).git commit -m 'Add feature'
).git push origin feature-branch
). Proyek ini menggunakan Lisensi MIT. Lihat file LICENSE
untuk detailnya.
Punya pertanyaan atau saran? Hubungi kami: