Ekstensi chrome yang dapat mengenali semua jenis teks di browser Anda dari video atau gambar apa pun menggunakan konsep OCR. OCR adalah kependekan dari Optical Character Recognition atau dengan kata lain mencari teks dalam gambar. Google sebelumnya telah merilis mesin bernama Tesseract OCR, artinya Google memberi Anda program yang sudah dilatih pengenalan teksnya, jadi saya tidak perlu melakukan hal rumit seperti melatih sendiri data di OCR. Namun untuk mendapatkan hasil yang lebih akurat, kita harus melakukan pra-pemrosesan gambar sebelum meneruskannya melalui Tesseract karena Tesseract memiliki beberapa kondisi yang telah ditentukan sebelumnya yang perlu diikuti untuk mendapatkan hasil yang akurat. Jadi untuk fungsionalitas ekstensi kita, pertama-tama ambil screenshot dari tab yang sedang dibuka, lalu potong bagian yang diinginkan menggunakan kanvas dan sesuaikan menggunakan binarisasi ambang batas sehingga dapat memenuhi persyaratan OCR untuk memberikan hasil yang lebih akurat. Kemudian kirimkan ke pytesseract (Tesseract versi Python) agar dapat mengkonversinya. Pada akhirnya, dapatkan teksnya dan unduh dalam format file .txt. Jadi pengguna dapat membukanya di notepad atau editor teks lainnya dan membandingkan serta memodifikasi teks jika diperlukan.
Saya sangat sering menjumpai cuplikan kode di youtube atau situs web lainnya, namun sekarang saya sangat menghargai upaya pembuat tutorial yang dimasukkan ke dalam video mereka setiap kali saya menemukan potongan kode yang tidak menyediakan tautan untuk mengunduh atau menyalinnya. Jadi untuk mendapatkan kode dari video tersebut saya membuat proyek ini dengan bantuan plugin tesseract sehingga saya dapat mengekstrak teks dari video atau gambar tersebut.
Implementasi dan demo modul dapat ditemukan di ppt.
pip install pytesseract
npm i flask
File jQuery min dilampirkan dengan file jika Anda ingin mengubahnya atau menggunakan pendekatan cdn, Anda dapat mengubahnya.