이 패키지에는 OCR 엔진 libtesseract
및 명령 줄 프로그램 tesseract
포함되어 있습니다.
Tesseract 4는 라인 인식에 중점을 둔 새로운 신경망 (LSTM) 기반 OCR 엔진을 추가하지만 캐릭터 패턴을 인식하여 작동하는 Tesseract 3의 레거시 Tesseract OCR 엔진을 여전히 지원합니다. 레거시 OCR 엔진 모드 (-oem 0)를 사용하여 TesserAct 3과의 호환성이 활성화됩니다. 또한 레거시 엔진을 지원하는 훈련 된 데이터 파일 (예 : TessData 저장소의 엔진)이 필요합니다.
Stefan Weil은 현재 리드 개발자입니다. Ray Smith는 2018 년까지 수석 개발자였습니다. 관리자는 Zdenko Podobny입니다. 기고자 목록은 저자와 Github의 기고자 로그를 참조하십시오.
TesserAct는 유니 코드 (UTF-8) 지원을 제공하며 100 개 이상의 언어를 "상자에서"인식 할 수 있습니다.
TesserAct는 PNG, JPEG 및 TIFF를 포함한 다양한 이미지 형식을 지원합니다.
TesserAct는 일반 텍스트, HTML (HOCR), PDF, Invisible-Text-only PDF, TSV, Alto 및 Page 의 다양한 출력 형식을 지원합니다.
많은 경우, 더 나은 OCR 결과를 얻으려면 TesserAct를 제공하는 이미지의 품질을 향상 시켜야합니다.
이 프로젝트에는 GUI 응용 프로그램이 포함되어 있지 않습니다 . 필요한 경우 3rdparty 문서를 참조하십시오.
TesserAct는 다른 언어를 인식하도록 훈련 될 수 있습니다 . 자세한 내용은 TesserAct 교육을 참조하십시오.
TesserAct는 원래 1985 년에서 1994 년 사이에 Hewlett-Packard Laboratories Bristol UK와 Hewlett-Packard Co의 Hewlett-Packard Co에서 1996 년에 Windows로 포트로, 1998 년에는 C ++ Izing에서 더 많은 변경 사항이 변경되었습니다. 2005 년 Tesseract HP가 공개했습니다. 2006 년부터 2018 년 11 월까지 Google이 개발했습니다.
주요 버전 5는 현재 안정 버전이며 2021 년 11 월 30 일 릴리스 5.0.0으로 시작했습니다. 새로운 마이너 버전과 버그 픽스 버전은 Github에서 제공됩니다.
최신 소스 코드는 Github의 Main Branch에서 사용할 수 있습니다. 개방형 문제는 문제 추적기 및 계획 문서에서 찾을 수 있습니다.
릴리스에 대한 자세한 내용은 릴리스 노트 및 변경 로그를 참조하십시오.
사전 제작 된 이진 패키지를 통해 TesserAct를 설치하거나 소스에서 빌드 할 수 있습니다.
소스에서 Tesseract를 구축하기 전에 시스템에 지원되는 컴파일러 중 하나 인 컴파일러가 있는지 확인하십시오.
기본 명령 줄 사용 :
tesseract imagename outputbase [-l lang] [--oem ocrenginemode] [--psm pagesegmode] [configfiles...]
다양한 명령 줄 옵션에 대한 자세한 내용은 tesseract --help
또는 man tesseract
사용하십시오.
예제는 문서에서 찾을 수 있습니다.
개발자는 libtesseract
c 또는 C ++ API를 사용하여 자체 애플리케이션을 구축 할 수 있습니다. 다른 프로그래밍 언어에 대해 libtesseract
에 바인딩이 필요한 경우 Addons 문서의 래퍼 섹션을 참조하십시오.
Doxygen에 의해 소스 코드에서 생성 된 TesserAct의 문서화는 TesserAct-ocr.github.io에서 찾을 수 있습니다.
문제를 제출하기 전에이 저장소에 대한 지침을 검토하십시오.
지원을 위해 먼저 문서, 특히 FAQ를 읽으려면 문제가 해결되는지 확인하십시오. 그렇지 않은 경우 TesserAct 사용자 포럼, TesserAct 개발자 포럼 및 과거 문제를 검색하고 여전히 필요한 것을 찾을 수 없다면 우편 사업자에 대한 지원을 요청하십시오.
메일 링리스트 :
질문을하는 것이 아니라 버그 에 대해서만 문제를보고하십시오.
The code in this repository is licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.
참고 :이 소프트웨어는 다른 오픈 소스 라이센스에 따라 라이센스가 부여 될 수있는 다른 패키지에 따라 다릅니다.
Tesseract는 본질적으로 BSD 2-Clause 라이센스를 사용하는 Leptonica 라이브러리를 사용합니다.
TesserAct는 입력 이미지 (예 : PDF와 같은 문서가 아님)를 열기 위해 Leptonica 라이브러리를 사용합니다. Zlib, PNG 및 TIFF (Multipage TIFF의 경우)를 지원하는 Leptonica를 사용하는 것이 좋습니다.
readme.md의 최신 온라인 버전은 다음을 참조하십시오.
https://github.com/tesseract-ocroc/tesseract/blob/main/readme.md