OCRmyPDF -Download - OCRmyPDF -Quellcode herunterladen

OCRmyPDF

Anderer Quellcode

v16.6.2

Herunterladen

OCRMYPDF fügt gescannte PDF-Dateien eine OCR-Textebene hinzu, sodass sie durchsucht oder kopiert werden können.

ocrmypdf                      # it's a scriptable command line program
   -l eng+fra                 # it supports multiple languages
   --rotate-pages             # it can fix pages that are misrotated
   --deskew                   # it can deskew crooked PDFs!
   --title " My PDF "           # it can change output metadata
   --jobs 4                   # it uses multiple cores by default
   --output-type pdfa         # it produces PDF/A by default
   input_scanned.pdf          # takes PDF input (or images)
   output_searchable.pdf      # produces validated PDF output

Weitere Informationen zu den neuesten Änderungen finden Sie in den Versionshinweise.

Hauptmerkmale

Generiert eine durchsuchbare PDF/eine Datei von einem regulären PDF
Stellen Sie den OCR -Text genau unter das Bild, um das Kopieren / Einfügen zu erleichtern
Hält die genaue Auflösung der ursprünglichen eingebetteten Bilder bei
Wenn möglich, fügt OCR -Informationen als "verlustfrei" -Operation ein, ohne andere Inhalte zu stören
Optimiert PDF -Bilder und erzeugt häufig Dateien, die kleiner als die Eingabedatei sind
Auf Wunsch, Deskews und/oder reinigt das Bild, bevor OCR durchgeführt wird
Validiert Eingabe- und Ausgabedateien
Verteilt die Arbeit über alle verfügbaren CPU -Kerne
Verwendet Tesseract OCR Engine, um mehr als 100 Sprachen zu erkennen
Hält Ihre privaten Daten privat.
Skalen ordnungsgemäß, um Dateien mit Tausenden von Seiten zu verarbeiten.
Kampf getestet auf Millionen von PDFs.

Für Details: Bitte konsultieren Sie die Dokumentation.

Motivation

Ich habe das Web nach einem kostenlosen Befehlszeilen -Tool gesucht, um PDF -Dateien zu ocr: Ich habe viele gefunden, aber keiner von ihnen war wirklich befriedigend:

Entweder erstellten sie PDF -Dateien mit verlegtem Text unter dem Bild (Kopieren/Einfügen unmöglich)
Oder sie haben keine Akzente und mehrsprachige Charaktere behandelt
Oder sie änderten die Auflösung der eingebetteten Bilder
Oder sie erzeugten lächerlich große PDF -Dateien
Oder sie stürzten ab, als sie versuchten, OCR zu machen
Oder sie haben keine gültigen PDF -Dateien erstellt
Darüber hinaus erzeugte keiner von ihnen PDF/A -Dateien (Format für lange Zeitspeicher)

... Also habe ich mich entschlossen, mein eigenes Werkzeug zu entwickeln.

Installation

Linux, Windows, MacOS und FreeBSD werden unterstützt. Docker -Bilder sind auch für X64 und ARM verfügbar.

Betriebssystem	Befehl installieren
Debian, Ubuntu	`apt install ocrmypdf`
Windows -Subsystem für Linux	`apt install ocrmypdf`
Fedora	`dnf install ocrmypdf`
macos (homebrew)	`brew install ocrmypdf`
macOS (Macports)	`port install ocrmypdf`
macOS (NIX)	`nix-env -i ocrmypdf`
Linuxbrew	`brew install ocrmypdf`
FreeBSD	`pkg install py-ocrmypdf`
Ubuntu Snap	`snap install ocrmypdf`

Für alle anderen finden Sie unsere Dokumentation für Installationsschritte.

Sprachen

OCRMYPDF verwendet Tesseract für OCR und stützt sich auf seine Sprachpakete. Für Linux -Benutzer finden Sie häufig Pakete, die Sprachpakete bereitstellen:

 # Display a list of all Tesseract language packs
apt-cache search tesseract-ocr

# Debian/Ubuntu users
apt-get install tesseract-ocr-chi-sim  # Example: Install Chinese Simplified language pack

# Arch Linux users
pacman -S tesseract-data-eng tesseract-data-deu # Example: Install the English and German language packs

# brew macOS users
brew install tesseract-lang

Sie können dann das Argument -l LANG an ocrmypdf weitergeben, um einen Hinweis darauf zu geben, welche Sprachen es suchen sollte. Es können mehrere Sprachen angefordert werden.

OCRMYPDF unterstützt Tesseract 4.1.1+. Es wird automatisch die Version verwendet, die es zuerst in der PATH findet. Wenn PATH unter Windows keine Tesseract -Binärdatei bietet, verwenden wir die höchste Versionsnummer, die gemäß der Windows -Registrierung installiert wird.

Dokumentation und Unterstützung

Sobald OCRMYPDF installiert ist, kann die integrierte Hilfe auf die Befehlssyntax und die Optionen erläutert werden.

ocrmypdf --help

Unsere Dokumentation wird in Lesen der Dokumente zugestellt.

Bitte melden Sie Probleme auf unserer Seite mit GitHub -Problemen und befolgen Sie die Problemvorlage, um eine schnelle Antwort zu erhalten.

Feature Demo

 # Add an OCR layer and convert to PDF/A
ocrmypdf input.pdf output.pdf

# Convert an image to single page PDF
ocrmypdf input.jpg output.pdf

# Add OCR to a file in place (only modifies file on success)
ocrmypdf myfile.pdf myfile.pdf

# OCR with non-English languages (look up your language's ISO 639-3 code)
ocrmypdf -l fra LeParisien.pdf LeParisien.pdf

# OCR multilingual documents
ocrmypdf -l eng+fra Bilingual-English-French.pdf Bilingual-English-French.pdf

# Deskew (straighten crooked pages)
ocrmypdf --deskew input.pdf output.pdf

Weitere Funktionen finden Sie in der Dokumentation.

Anforderungen

Zusätzlich zur erforderlichen Python -Version benötigt OCRMYPDF externe Programminstallationen von Ghostscript und Tesseract OCR. OCRMYPDF ist reines Python und läuft so ziemlich alles: Linux, MacOS, Windows und FreeBSD.

Press & Medien

Ohne ocrmypdf papierlos gehen
Konvertieren eines gescannten Dokuments in ein komprimiertes durchsuchbares PDF mit Redaktionen
C't 1-2014, Seite 59: Detaillierte Präsentation von OCRMYPDF V1.0 im führenden Deutschen IT-Magazin C't
Heise Open Source, 09.09.2014: TexterKennung MIT OCRMYPDF
Heise Durchsuchbare PDF-Dokumente mit Ocrmypdferformen
Ausgezeichnete Dienstprogramme: OCRMYPDF
Linuxuser TexterKennung MIT OCRMYPDF UND SCANBD AUTOMATIENEN
Y Kombinatordiskussion

Geschäftsanfragen

OCRMYPDF wäre nicht die Software, die heute ohne Unternehmen und Benutzer sich entscheiden, um Unterstützung für die Entwicklung von Funktionen und Beratungsanfragen zu unterstützen. Wir freuen uns, alle Anfragen zu diskutieren, sei es zur Erweiterung des vorhandenen Feature -Sets oder zur Integration von OCRMYPDF in ein größeres System.

Lizenz

Die OCRMYPDF-Software ist unter der Mozilla Public Lizenz 2.0 (MPL-2.0) lizenziert. Diese Lizenz ermöglicht die Integration von OCRMYPDF mit einem anderen Code, beinhaltete kommerzielle und geschlossene Quelle, fordert Sie jedoch auf, Änderungen auf Quellenebene an OCRMYPDF zu veröffentlichen.

Einige Komponenten von OCRMYPDF haben andere Lizenzen, wie durch Standard -SPDX -Lizenzkennungen oder die DEP5 -Copyright- und Lizenzinformationsdatei angegeben. Im Allgemeinen ist der Nicht-Core-Code unter MIT lizenziert und die Dokumentations- und Testdateien werden unter Creative Commons Sharealike 4.0 (CC-by-SA 4.0) lizenziert.