Unduh Image to text chrome extension - Unduh kode sumber Image to text chrome extension

Image to text chrome extension

Kategori lainnya

1.0.0

Unduh

Ekstensi gambar-ke-teks-chrome

Abstrak

Ekstensi chrome yang dapat mengenali semua jenis teks di browser Anda dari video atau gambar apa pun menggunakan konsep OCR. OCR adalah kependekan dari Optical Character Recognition atau dengan kata lain mencari teks dalam gambar. Google sebelumnya telah merilis mesin bernama Tesseract OCR, artinya Google memberi Anda program yang sudah dilatih pengenalan teksnya, jadi saya tidak perlu melakukan hal rumit seperti melatih sendiri data di OCR. Namun untuk mendapatkan hasil yang lebih akurat, kita harus melakukan pra-pemrosesan gambar sebelum meneruskannya melalui Tesseract karena Tesseract memiliki beberapa kondisi yang telah ditentukan sebelumnya yang perlu diikuti untuk mendapatkan hasil yang akurat. Jadi untuk fungsionalitas ekstensi kita, pertama-tama ambil screenshot dari tab yang sedang dibuka, lalu potong bagian yang diinginkan menggunakan kanvas dan sesuaikan menggunakan binarisasi ambang batas sehingga dapat memenuhi persyaratan OCR untuk memberikan hasil yang lebih akurat. Kemudian kirimkan ke pytesseract (Tesseract versi Python) agar dapat mengkonversinya. Pada akhirnya, dapatkan teksnya dan unduh dalam format file .txt. Jadi pengguna dapat membukanya di notepad atau editor teks lainnya dan membandingkan serta memodifikasi teks jika diperlukan.

Motivasi di balik proyek ini

Saya sangat sering menjumpai cuplikan kode di youtube atau situs web lainnya, namun sekarang saya sangat menghargai upaya pembuat tutorial yang dimasukkan ke dalam video mereka setiap kali saya menemukan potongan kode yang tidak menyediakan tautan untuk mengunduh atau menyalinnya. Jadi untuk mendapatkan kode dari video tersebut saya membuat proyek ini dengan bantuan plugin tesseract sehingga saya dapat mengekstrak teks dari video atau gambar tersebut.