PyMuPDF é uma biblioteca Python de alto desempenho para extração, análise, conversão e manipulação de dados de documentos PDF (e outros).
Junte-se a nós no Discord aqui: #pymupdf
PyMuPDF requer Python 3.9 ou posterior , instale usando pip com:
pip install PyMuPDF
Não há dependências externas obrigatórias . No entanto, alguns recursos opcionais ficam disponíveis somente se pacotes adicionais forem instalados.
Você também pode tentar sem instalar visitando PyMuPDF.io.
O uso básico é o seguinte:
import pymupdf # imports the pymupdf library
doc = pymupdf . open ( "example.pdf" ) # open a document
for page in doc : # iterate the document pages
text = page . get_text () # get plain text encoded as UTF-8
A documentação completa pode ser encontrada em pymupdf.readthedocs.io.
PyMuPDF adiciona ligações e abstrações Python ao MuPDF, um visualizador, renderizador e kit de ferramentas leve de PDF , XPS e e-book . Tanto PyMuPDF quanto MuPDF são mantidos e desenvolvidos pela Artifex Software, Inc.
PyMuPDF foi originalmente escrito por Jorj X. McKie.
PyMuPDF está disponível sob AGPL de código aberto e acordos de licença comercial. Se você determinar que não pode atender aos requisitos da AGPL , entre em contato com a Artifex para obter mais informações sobre uma licença comercial.