Загрузка PyMuPDF - Загрузка исходного кода PyMuPDF

PyMuPDF

Питон

PyMuPD

Скачать

ПиМуPDF

PyMuPDF — это высокопроизводительная библиотека Python для извлечения, анализа, преобразования и обработки данных PDF (и других) документов.

Сообщество

Присоединяйтесь к нам в Discord здесь: #pymupdf

Установка

Для PyMuPDF требуется Python 3.9 или новее , установите его с помощью pip с помощью:

pip install PyMuPDF

Обязательных внешних зависимостей нет . Однако некоторые дополнительные функции становятся доступными только в случае установки дополнительных пакетов.

Вы также можете попробовать без установки, посетив PyMuPDF.io.

Использование

Основное использование заключается в следующем:

 import pymupdf # imports the pymupdf library
doc = pymupdf . open ( "example.pdf" ) # open a document
for page in doc : # iterate the document pages
  text = page . get_text () # get plain text encoded as UTF-8

Документация

Полную документацию можно найти на pymupdf.readthedocs.io.

Дополнительные функции

FontTools для создания подмножеств шрифтов.
pymupdf-fonts содержит несколько хороших шрифтов для вывода текста.
Tesseract-OCR для оптического распознавания символов на изображениях и страницах документов.

О

PyMuPDF добавляет привязки и абстракции Python в MuPDF, облегченную программу просмотра, средства рендеринга и инструментов PDF , XPS и электронных книг . И PyMuPDF , и MuPDF поддерживаются и разрабатываются Artifex Software, Inc.

PyMuPDF был первоначально написан Джорджем X. Маккаем.

Лицензия и авторские права

PyMuPDF доступен по соглашениям AGPL с открытым исходным кодом и коммерческой лицензии. Если вы решите, что не можете соответствовать требованиям AGPL , свяжитесь с Artifex для получения дополнительной информации о коммерческой лицензии.

Расширять

Дополнительная информация