PyMuPDF — это высокопроизводительная библиотека Python для извлечения, анализа, преобразования и обработки данных PDF (и других) документов.
Присоединяйтесь к нам в Discord здесь: #pymupdf
Для PyMuPDF требуется Python 3.9 или новее , установите его с помощью pip с помощью:
pip install PyMuPDF
Обязательных внешних зависимостей нет . Однако некоторые дополнительные функции становятся доступными только в случае установки дополнительных пакетов.
Вы также можете попробовать без установки, посетив PyMuPDF.io.
Основное использование заключается в следующем:
import pymupdf # imports the pymupdf library
doc = pymupdf . open ( "example.pdf" ) # open a document
for page in doc : # iterate the document pages
text = page . get_text () # get plain text encoded as UTF-8
Полную документацию можно найти на pymupdf.readthedocs.io.
PyMuPDF добавляет привязки и абстракции Python в MuPDF, облегченную программу просмотра, средства рендеринга и инструментов PDF , XPS и электронных книг . И PyMuPDF , и MuPDF поддерживаются и разрабатываются Artifex Software, Inc.
PyMuPDF был первоначально написан Джорджем X. Маккаем.
PyMuPDF доступен по соглашениям AGPL с открытым исходным кодом и коммерческой лицензии. Если вы решите, что не можете соответствовать требованиям AGPL , свяжитесь с Artifex для получения дополнительной информации о коммерческой лицензии.