Dieses Paket stellt eine Klasse zum Extrahieren von Text aus einem PDF bereit.
use Spatie PdfToText Pdf ;
echo Pdf:: getText ( ' book.pdf ' ); //returns the text from the pdf
Spatie ist eine Webdesign-Agentur mit Sitz in Antwerpen, Belgien. Eine Übersicht aller unserer Open-Source-Projekte finden Sie auf unserer Website.
Wir investieren viele Ressourcen in die Erstellung erstklassiger Open-Source-Pakete. Sie können uns unterstützen, indem Sie eines unserer kostenpflichtigen Produkte kaufen.
Wir freuen uns sehr, dass Sie uns eine Postkarte aus Ihrer Heimatstadt schicken und erwähnen, welches unserer Pakete Sie verwenden. Unsere Adresse finden Sie auf unserer Kontaktseite. Wir veröffentlichen alle erhaltenen Postkarten auf unserer virtuellen Postkartenwand.
Hinter den Kulissen nutzt dieses Paket pdftotext. Sie können überprüfen, ob die Binärdatei auf Ihrem System installiert ist, indem Sie diesen Befehl eingeben:
which pdftotext
Wenn es installiert ist, wird der Pfad zur Binärdatei zurückgegeben.
Um die Binärdatei zu installieren, können Sie unter Ubuntu oder Debian diesen Befehl verwenden:
apt-get install poppler-utils
Auf einem Mac können Sie die Binärdatei mit brew installieren
brew install poppler
Wenn Sie RedHat, CentOS, Rocky Linux oder Fedora verwenden, verwenden Sie Folgendes:
yum install poppler-utils
Sie können das Paket über Composer installieren:
composer require spatie/pdf-to-text
Das Extrahieren von Text aus einem PDF ist einfach.
$ text = ( new Pdf ())
-> setPdf ( ' book.pdf ' )
-> text ();
Oder einfacher:
echo Pdf:: getText ( ' book.pdf ' );
Standardmäßig geht das Paket davon aus, dass sich der Befehl pdftotext
unter /usr/bin/pdftotext
befindet. Wenn es sich woanders befindet, übergeben Sie seinen Binärpfad an den Konstruktor
$ text = ( new Pdf ( ' /custom/path/to/pdftotext ' ))
-> setPdf ( ' book.pdf ' )
-> text ();
oder als zweiter Parameter der statischen Methode getText
:
echo Pdf:: getText ( ' book.pdf ' , ' /custom/path/to/pdftotext ' );
Manchmal möchten Sie möglicherweise pdftotext-Optionen verwenden. Dazu können Sie sie mit der setOptions
-Methode einrichten.
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> text ()
;
oder als dritter Parameter der statischen Methode getText
:
echo Pdf:: getText ( ' book.pdf ' , null , [ ' layout ' , ' opw myP1$$Word ' ]);
Bitte beachten Sie, dass aufeinanderfolgende Aufrufe von setOptions()
die bei vorherigen Aufrufen übergebenen Optionen überschreiben.
Wenn Sie mehrere Aufrufe zum Hinzufügen von Optionen durchführen müssen (z. B. wenn Sie beim Erstellen des Pdf
Objekts aus einem Container Standardoptionen übergeben und dann an anderer Stelle kontextspezifische Optionen hinzufügen müssen), können Sie die Methode addOptions()
verwenden:
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> addOptions ([ ' f 1 ' ])
-> text ()
;
Weitere Informationen zu den letzten Änderungen finden Sie im CHANGELOG.
composer test
Weitere Informationen finden Sie unter BEITRAGEN.
Wenn Sie einen Sicherheitsfehler gefunden haben, senden Sie bitte eine E-Mail an [email protected], anstatt den Issue-Tracker zu verwenden.
Spatie ist eine Webdesign-Agentur mit Sitz in Antwerpen, Belgien. Eine Übersicht aller unserer Open-Source-Projekte finden Sie auf unserer Website.
Die MIT-Lizenz (MIT). Weitere Informationen finden Sie in der Lizenzdatei.