WebSpeechRecognition هي مكتبة Python تساعد في تحويل الكلام إلى نص في الوقت الفعلي. ويستخدم Selenium WebDriver وHTML5 Web Speech API. تم تصميم هذه الأداة للعمل مع Chrome WebDriver وهي سهلة الاستخدام لمهام التعرف على الكلام.
لتثبيت WebSpeechRecognition ، يمكنك استخدام النقطة:
pip install WebSpeechRecognition
لبدء استخدام WebSpeechRecognition ، قم بتهيئة فئة SpeechRecognition
بالمسار إلى ChromeDriver القابل للتنفيذ ورمز اللغة:
from WebSpeechRecognition import SpeechRecognition
recognizer = SpeechRecognition ( "path/to/chromedriver" , language = "en-US" )
recognizer . Init ()
لبدء الاستماع وتسجيل الكلام، استخدم طريقة Listen
. تقوم هذه الطريقة بإرجاع النص المكتوب:
text = recognizer . Listen ( print_allowed = True )
print ( f"You said: { text } " )
بمجرد الانتهاء، استخدم طريقة Quit
لإغلاق مثيل ChromeDriver:
recognizer . Quit ()
هنا مثال كامل:
from WebSpeechRecognition import SpeechRecognition
recognizer = SpeechRecognition ( "path/to/chromedriver" , language = "en-US" )
recognizer . Init ()
while True :
try :
text = recognizer . Listen ( print_allowed = True )
print ( f"You said: { text } " )
except KeyboardInterrupt :
recognizer . Quit ()
break
SpeechRecognition(driver_path, language)
driver_path
: المسار إلى ملف Chrome WebDriver.language
: رمز اللغة للتعرف (الافتراضي: "en-US").Init()
يقوم بإعداد WebDriver مع خيارات التعرف على الكلام.
Listen(print_allowed=False)
يبدأ الاستماع ويعيد النص الذي يسمعه.
print_allowed
: إذا كان True، فسيتم طباعة النص الذي تم التعرف عليه إلى وحدة التحكم.Quit()
يوقف WebDriver ويغلق كل شيء.
نحن نرحب بالمساهمات! إذا وجدت خطأ ما أو كانت لديك فكرة عن ميزة جديدة، فلا تتردد في فتح مشكلة أو طلب سحب على مستودع GitHub الخاص بنا.
هل تريد المساعدة في تحسين التعرف على الكلام؟ وإليك الطريقة:
git checkout -b feature-branch
).git commit -m 'Add feature'
).git push origin feature-branch
). يستخدم هذا المشروع ترخيص MIT. راجع ملف LICENSE
للحصول على التفاصيل.
هل لديك أسئلة أو اقتراحات؟ اتصل بنا: