PyMuPDF
PyMuPD
PyMuPDFは、PDF (およびその他) ドキュメントのデータ抽出、分析、変換および操作のための高性能Pythonライブラリです。
ここからDiscordに参加してください: #pymupdf
PyMuPDF にはPython 3.9 以降が必要です。以下のpipを使用してインストールします。
pip install PyMuPDF
必須の外部依存関係はありません。ただし、一部のオプション機能は、追加のパッケージがインストールされている場合にのみ使用可能になります。
PyMuPDF.io にアクセスして、インストールせずに試すこともできます。
基本的な使い方は以下の通りです。
import pymupdf # imports the pymupdf library
doc = pymupdf . open ( "example.pdf" ) # open a document
for page in doc : # iterate the document pages
text = page . get_text () # get plain text encoded as UTF-8
完全なドキュメントは pymupdf.readthedocs.io にあります。
PyMuPDF は、軽量のPDF 、 XPS 、およびeBookビューア、レンダラ、およびツールキットである MuPDF にPythonバインディングと抽象化を追加します。 PyMuPDFとMuPDF はどちらも Artifex Software, Inc. によって保守および開発されています。
PyMuPDF はもともと Jorj X. McKie によって書かれました。
PyMuPDF は、オープンソースの AGPL および商用ライセンス契約に基づいて利用できます。 AGPLの要件を満たすことができないと判断した場合は、商用ライセンスに関する詳細について Artifex にお問い合わせください。