PyMuPDF adalah pustaka Python berkinerja tinggi untuk ekstraksi data, analisis, konversi & manipulasi dokumen PDF (dan lainnya).
Bergabunglah dengan kami di Discord di sini: #pymupdf
PyMuPDF memerlukan Python 3.9 atau lebih baru , instal menggunakan pip dengan:
pip install PyMuPDF
Tidak ada ketergantungan eksternal wajib . Namun, beberapa fitur opsional hanya tersedia jika paket tambahan diinstal.
Anda juga dapat mencoba tanpa menginstal dengan mengunjungi PyMuPDF.io.
Penggunaan dasar adalah sebagai berikut:
import pymupdf # imports the pymupdf library
doc = pymupdf . open ( "example.pdf" ) # open a document
for page in doc : # iterate the document pages
text = page . get_text () # get plain text encoded as UTF-8
Dokumentasi lengkap dapat ditemukan di pymupdf.readthedocs.io.
PyMuPDF menambahkan pengikatan dan abstraksi Python ke MuPDF, PDF ringan, XPS , dan penampil eBook , penyaji, dan perangkat. PyMuPDF dan MuPDF dikelola dan dikembangkan oleh Artifex Software, Inc.
PyMuPDF aslinya ditulis oleh Jorj X. McKie.
PyMuPDF tersedia berdasarkan AGPL sumber terbuka dan perjanjian lisensi komersial. Jika Anda memutuskan bahwa Anda tidak dapat memenuhi persyaratan AGPL , silakan hubungi Artifex untuk informasi lebih lanjut mengenai lisensi komersial.