ส่วนขยาย Chrome ที่สามารถจดจำข้อความประเภทใดก็ได้ในเบราว์เซอร์ของคุณจากวิดีโอหรือรูปภาพใด ๆ โดยใช้แนวคิดของ OCR OCR เป็นรูปแบบสั้นของการรู้จำอักขระด้วยแสงหรือในข้อความค้นหาคำอื่นๆ ในรูปภาพ ก่อนหน้านี้ Google ได้เปิดตัวกลไกชื่อ Tesseract OCR ซึ่งหมายความว่า Google มีโปรแกรมที่ได้รับการฝึกฝนการจดจำข้อความอยู่แล้ว ดังนั้นฉันจึงไม่ต้องทำสิ่งที่ซับซ้อน เช่น ฝึกข้อมูลใน OCR ด้วยตัวเอง แต่เพื่อให้ได้ความแม่นยำมากขึ้น เราต้องประมวลผลภาพล่วงหน้าก่อนที่จะส่งผ่าน Tesseract เนื่องจาก Tesseract มีสถานการณ์ที่กำหนดไว้ล่วงหน้าซึ่งจำเป็นต้องปฏิบัติตามเพื่อให้ได้ผลลัพธ์ที่แม่นยำ ดังนั้นสำหรับฟังก์ชันการทำงานของส่วนขยายของเรา ขั้นแรกจะต้องจับภาพหน้าจอจากแท็บที่เปิดอยู่ในปัจจุบัน จากนั้นครอบตัดส่วนที่ต้องการโดยใช้ Canvas และปรับโดยใช้ Threshold Binarization เพื่อให้สามารถเติมเต็มข้อกำหนด OCR เพื่อให้ได้ผลลัพธ์ที่แม่นยำยิ่งขึ้น จากนั้นส่งไปที่ pytesseract (Tesseract เวอร์ชัน Python) เพื่อให้สามารถแปลงได้ ในตอนท้ายได้รับข้อความและดาวน์โหลดในรูปแบบไฟล์ .txt ดังนั้นผู้ใช้สามารถเปิดมันในแผ่นจดบันทึกหรือโปรแกรมแก้ไขข้อความอื่น ๆ และเปรียบเทียบและแก้ไขข้อความได้หากจำเป็น
ฉันมักจะพบตัวอย่างโค้ดบน youtube หรือเว็บไซต์อื่น ๆ บ่อยครั้ง แต่ขณะนี้ฉันซาบซึ้งอย่างมากกับความพยายามของผู้สร้างบทช่วยสอนที่ใส่ลงในวิดีโอของพวกเขาทุกครั้งที่พบโค้ดที่ไม่มีลิงก์สำหรับดาวน์โหลดหรือคัดลอก ดังนั้นเพื่อให้ได้โค้ดจากวิดีโอเหล่านั้น ฉันจึงสร้างโปรเจ็กต์นี้ด้วยความช่วยเหลือของปลั๊กอิน tesseract ดังนั้นฉันจึงสามารถแยกข้อความจากวิดีโอหรือรูปภาพเหล่านั้นได้
การใช้งานโมดูลและการสาธิตสามารถพบได้ใน ppt
pip install pytesseract
npm i flask
ไฟล์ jQuery min ถูกแนบมากับไฟล์ในกรณีที่คุณต้องการเปลี่ยนหรือใช้วิธี cdn คุณสามารถเปลี่ยนได้