PyMuPDF ist eine leistungsstarke Python- Bibliothek zur Datenextraktion, Analyse, Konvertierung und Bearbeitung von PDF-Dokumenten (und anderen).
Treten Sie uns hier auf Discord bei: #pymupdf
PyMuPDF erfordert Python 3.9 oder höher , installieren Sie es mit pip mit:
pip install PyMuPDF
Es gibt keine zwingenden externen Abhängigkeiten. Einige optionale Funktionen werden jedoch erst verfügbar, wenn zusätzliche Pakete installiert werden.
Sie können es auch ohne Installation versuchen, indem Sie PyMuPDF.io besuchen.
Die grundlegende Verwendung ist wie folgt:
import pymupdf # imports the pymupdf library
doc = pymupdf . open ( "example.pdf" ) # open a document
for page in doc : # iterate the document pages
text = page . get_text () # get plain text encoded as UTF-8
Die vollständige Dokumentation finden Sie unter pymupdf.readthedocs.io.
PyMuPDF fügt Python- Bindungen und Abstraktionen zu MuPDF hinzu, einem kompakten PDF- , XPS- und eBook- Viewer, Renderer und Toolkit. Sowohl PyMuPDF als auch MuPDF werden von Artifex Software, Inc. gepflegt und entwickelt.
PyMuPDF wurde ursprünglich von Jorj X. McKie geschrieben.
PyMuPDF ist unter Open-Source-AGPL und kommerziellen Lizenzvereinbarungen verfügbar. Wenn Sie feststellen, dass Sie die Anforderungen der AGPL nicht erfüllen können, wenden Sie sich bitte an Artifex, um weitere Informationen zu einer kommerziellen Lizenz zu erhalten.