Paket ini menyediakan kelas untuk mengekstrak teks dari pdf.
use Spatie PdfToText Pdf ;
echo Pdf:: getText ( ' book.pdf ' ); //returns the text from the pdf
Spatie adalah agen desain web yang berbasis di Antwerp, Belgia. Anda akan menemukan ikhtisar semua proyek sumber terbuka kami di situs web kami.
Kami menginvestasikan banyak sumber daya untuk menciptakan paket sumber terbuka terbaik di kelasnya. Anda dapat mendukung kami dengan membeli salah satu produk berbayar kami.
Kami sangat menghargai Anda mengirimi kami kartu pos dari kota asal Anda, yang menyebutkan paket kami mana yang Anda gunakan. Anda akan menemukan alamat kami di halaman kontak kami. Kami mempublikasikan semua kartu pos yang diterima di dinding kartu pos virtual kami.
Di balik layar, paket ini memanfaatkan pdftotext. Anda dapat memverifikasi apakah biner terinstal di sistem Anda dengan mengeluarkan perintah ini:
which pdftotext
Jika diinstal maka akan mengembalikan jalur ke biner.
Untuk menginstal biner Anda dapat menggunakan perintah ini di Ubuntu atau Debian:
apt-get install poppler-utils
Di Mac Anda dapat menginstal biner menggunakan brew
brew install poppler
Jika Anda menggunakan RedHat, CentOS, Rocky Linux atau Fedora gunakan ini:
yum install poppler-utils
Anda dapat menginstal paket melalui composer:
composer require spatie/pdf-to-text
Mengekstrak teks dari pdf itu mudah.
$ text = ( new Pdf ())
-> setPdf ( ' book.pdf ' )
-> text ();
Atau lebih mudah:
echo Pdf:: getText ( ' book.pdf ' );
Secara default paket akan mengasumsikan bahwa perintah pdftotext
terletak di /usr/bin/pdftotext
. Jika terletak di tempat lain, teruskan jalur binernya ke konstruktor
$ text = ( new Pdf ( ' /custom/path/to/pdftotext ' ))
-> setPdf ( ' book.pdf ' )
-> text ();
atau sebagai parameter kedua pada metode statis getText
:
echo Pdf:: getText ( ' book.pdf ' , ' /custom/path/to/pdftotext ' );
Terkadang Anda mungkin ingin menggunakan opsi pdftotext. Untuk melakukannya, Anda dapat mengaturnya menggunakan metode setOptions
.
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> text ()
;
atau sebagai parameter ketiga pada metode statis getText
:
echo Pdf:: getText ( ' book.pdf ' , null , [ ' layout ' , ' opw myP1$$Word ' ]);
Harap perhatikan bahwa panggilan berturut-turut ke setOptions()
akan menimpa opsi yang diteruskan selama panggilan sebelumnya.
Jika Anda perlu melakukan beberapa panggilan untuk menambahkan opsi (misalnya jika Anda perlu memasukkan opsi default saat membuat objek Pdf
dari sebuah kontainer, lalu menambahkan opsi spesifik konteks di tempat lain), Anda dapat menggunakan metode addOptions()
:
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> addOptions ([ ' f 1 ' ])
-> text ()
;
Silakan lihat CHANGELOG untuk informasi lebih lanjut tentang apa yang berubah baru-baru ini.
composer test
Silakan lihat KONTRIBUSI untuk rinciannya.
Jika Anda menemukan bug terkait keamanan, silakan kirim email ke [email protected] alih-alih menggunakan pelacak masalah.
Spatie adalah agen desain web yang berbasis di Antwerp, Belgia. Anda akan menemukan ikhtisar semua proyek sumber terbuka kami di situs web kami.
Lisensi MIT (MIT). Silakan lihat File Lisensi untuk informasi lebih lanjut.