ดาวน์โหลด Image to text chrome extension - ดาวน์โหลดซอร์สโค้ด Image to text chrome extension

Image to text chrome extension

หมวดหมู่อื่นๆ

1.0.0

ดาวน์โหลด

ส่วนขยายรูปภาพเป็นข้อความ Chrome

เชิงนามธรรม

ส่วนขยาย Chrome ที่สามารถจดจำข้อความประเภทใดก็ได้ในเบราว์เซอร์ของคุณจากวิดีโอหรือรูปภาพใด ๆ โดยใช้แนวคิดของ OCR OCR เป็นรูปแบบสั้นของการรู้จำอักขระด้วยแสงหรือในข้อความค้นหาคำอื่นๆ ในรูปภาพ ก่อนหน้านี้ Google ได้เปิดตัวกลไกชื่อ Tesseract OCR ซึ่งหมายความว่า Google มีโปรแกรมที่ได้รับการฝึกฝนการจดจำข้อความอยู่แล้ว ดังนั้นฉันจึงไม่ต้องทำสิ่งที่ซับซ้อน เช่น ฝึกข้อมูลใน OCR ด้วยตัวเอง แต่เพื่อให้ได้ความแม่นยำมากขึ้น เราต้องประมวลผลภาพล่วงหน้าก่อนที่จะส่งผ่าน Tesseract เนื่องจาก Tesseract มีสถานการณ์ที่กำหนดไว้ล่วงหน้าซึ่งจำเป็นต้องปฏิบัติตามเพื่อให้ได้ผลลัพธ์ที่แม่นยำ ดังนั้นสำหรับฟังก์ชันการทำงานของส่วนขยายของเรา ขั้นแรกจะต้องจับภาพหน้าจอจากแท็บที่เปิดอยู่ในปัจจุบัน จากนั้นครอบตัดส่วนที่ต้องการโดยใช้ Canvas และปรับโดยใช้ Threshold Binarization เพื่อให้สามารถเติมเต็มข้อกำหนด OCR เพื่อให้ได้ผลลัพธ์ที่แม่นยำยิ่งขึ้น จากนั้นส่งไปที่ pytesseract (Tesseract เวอร์ชัน Python) เพื่อให้สามารถแปลงได้ ในตอนท้ายได้รับข้อความและดาวน์โหลดในรูปแบบไฟล์ .txt ดังนั้นผู้ใช้สามารถเปิดมันในแผ่นจดบันทึกหรือโปรแกรมแก้ไขข้อความอื่น ๆ และเปรียบเทียบและแก้ไขข้อความได้หากจำเป็น

แรงจูงใจเบื้องหลังโครงการ

ฉันมักจะพบตัวอย่างโค้ดบน youtube หรือเว็บไซต์อื่น ๆ บ่อยครั้ง แต่ขณะนี้ฉันซาบซึ้งอย่างมากกับความพยายามของผู้สร้างบทช่วยสอนที่ใส่ลงในวิดีโอของพวกเขาทุกครั้งที่พบโค้ดที่ไม่มีลิงก์สำหรับดาวน์โหลดหรือคัดลอก ดังนั้นเพื่อให้ได้โค้ดจากวิดีโอเหล่านั้น ฉันจึงสร้างโปรเจ็กต์นี้ด้วยความช่วยเหลือของปลั๊กอิน tesseract ดังนั้นฉันจึงสามารถแยกข้อความจากวิดีโอหรือรูปภาพเหล่านั้นได้