PyMuPDF es una biblioteca Python de alto rendimiento para extracción, análisis, conversión y manipulación de datos de documentos PDF (y otros).
Únase a nosotros en Discord aquí: #pymupdf
PyMuPDF requiere Python 3.9 o posterior , instálelo usando pip con:
pip install PyMuPDF
No hay dependencias externas obligatorias . Sin embargo, algunas funciones opcionales estarán disponibles sólo si se instalan paquetes adicionales.
También puedes probar sin instalar visitando PyMuPDF.io.
El uso básico es el siguiente:
import pymupdf # imports the pymupdf library
doc = pymupdf . open ( "example.pdf" ) # open a document
for page in doc : # iterate the document pages
text = page . get_text () # get plain text encoded as UTF-8
La documentación completa se puede encontrar en pymupdf.readthedocs.io.
PyMuPDF agrega enlaces y abstracciones de Python a MuPDF, un visor, renderizador y conjunto de herramientas liviano de PDF , XPS y libros electrónicos . Tanto PyMuPDF como MuPDF son mantenidos y desarrollados por Artifex Software, Inc.
PyMuPDF fue escrito originalmente por Jorj X. McKie.
PyMuPDF está disponible bajo AGPL de código abierto y acuerdos de licencia comercial. Si determina que no puede cumplir con los requisitos de AGPL , comuníquese con Artifex para obtener más información sobre una licencia comercial.