Image to text chrome extension
1.0.0
一個 Chrome 擴充程序,可以使用 OCR 的概念從任何影片或圖像中識別瀏覽器中的任何類型的文字。 OCR 是光學字元辨識或圖像中的其他單字尋找文字的簡稱。 Google 之前發布了一個名為 Tesseract OCR 的引擎,這意味著 Google 為您提供了一個已經訓練有文字識別的程序,因此我不必自己做 OCR 資料訓練等複雜的事情。但為了獲得更準確的結果,我們必須在將影像傳遞給 Tesseract 之前對影像進行預處理,因為 Tesseract 有一些預先定義的情況,需要遵循這些情況才能獲得準確的結果。因此,對於我們擴展的功能,它首先從當前打開的選項卡中截取螢幕截圖,然後使用畫布裁剪所需的部分,並使用閾值二值化進行調整,以便它可以滿足OCR 要求,從而提供更準確的結果。然後將其傳送到 pytesseract(Tesseract 的 Python 版本),以便它可以對其進行轉換。最後取得文字並以 .txt 檔案格式下載。因此,使用者可以在記事本或任何其他文字編輯器中開啟它,並根據需要比較和修改文字。
我經常在 youtube 或任何其他網站上遇到程式碼片段,但現在,每當我遇到一段不提供下載或複製連結的程式碼時,我都非常感謝教學製作者在他們的影片中投入的精力。因此,為了從這些影片中獲取程式碼,我在 tesseract 外掛程式的幫助下製作了這個項目,這樣我就可以從這些影片或圖像中提取文字。
模組實作和演示可以在ppt中找到。
pip install pytesseract
npm i flask
jQuery min 檔案附加在檔案中,如果您想要變更它或使用 cdn 方法,您可以變更它。