PyMuPDF est une bibliothèque Python hautes performances pour l'extraction de données, l'analyse, la conversion et la manipulation de documents PDF (et autres).
Rejoignez-nous sur Discord ici : #pymupdf
PyMuPDF nécessite Python 3.9 ou version ultérieure , installez-le en utilisant pip avec :
pip install PyMuPDF
Il n’y a pas de dépendances externes obligatoires . Cependant, certaines fonctionnalités facultatives ne deviennent disponibles que si des packages supplémentaires sont installés.
Vous pouvez également essayer sans installer en visitant PyMuPDF.io.
L'utilisation de base est la suivante :
import pymupdf # imports the pymupdf library
doc = pymupdf . open ( "example.pdf" ) # open a document
for page in doc : # iterate the document pages
text = page . get_text () # get plain text encoded as UTF-8
La documentation complète peut être trouvée sur pymupdf.readthedocs.io.
PyMuPDF ajoute des liaisons et des abstractions Python à MuPDF, une visionneuse, un moteur de rendu et une boîte à outils légers pour PDF , XPS et eBook . PyMuPDF et MuPDF sont maintenus et développés par Artifex Software, Inc.
PyMuPDF a été initialement écrit par Jorj X. McKie.
PyMuPDF est disponible sous AGPL open source et accords de licence commerciale. Si vous déterminez que vous ne pouvez pas répondre aux exigences de l' AGPL , veuillez contacter Artifex pour plus d'informations concernant une licence commerciale.