Ce package fournit un cours pour extraire le texte d'un pdf.
use Spatie PdfToText Pdf ;
echo Pdf:: getText ( ' book.pdf ' ); //returns the text from the pdf
Spatie est une agence de webdesign basée à Anvers, en Belgique. Vous trouverez un aperçu de tous nos projets open source sur notre site Internet.
Nous investissons beaucoup de ressources dans la création des meilleurs packages open source de leur catégorie. Vous pouvez nous soutenir en achetant l'un de nos produits payants.
Nous apprécions grandement que vous nous envoyiez une carte postale de votre ville natale, mentionnant le(s) forfait(s) que vous utilisez. Vous trouverez notre adresse sur notre page contact. Nous publions toutes les cartes postales reçues sur notre mur virtuel de cartes postales.
En coulisses, ce package exploite pdftotext. Vous pouvez vérifier si le binaire est installé sur votre système en exécutant cette commande :
which pdftotext
S'il est installé, il renverra le chemin d'accès au binaire.
Pour installer le binaire, vous pouvez utiliser cette commande sur Ubuntu ou Debian :
apt-get install poppler-utils
Sur un Mac, vous pouvez installer le binaire en utilisant Brew
brew install poppler
Si vous utilisez RedHat, CentOS, Rocky Linux ou Fedora, utilisez ceci :
yum install poppler-utils
Vous pouvez installer le package via composer :
composer require spatie/pdf-to-text
Extraire du texte d’un pdf est facile.
$ text = ( new Pdf ())
-> setPdf ( ' book.pdf ' )
-> text ();
Ou plus simple :
echo Pdf:: getText ( ' book.pdf ' );
Par défaut, le package supposera que la commande pdftotext
se trouve dans /usr/bin/pdftotext
. S'il se trouve ailleurs, transmettez son chemin binaire au constructeur
$ text = ( new Pdf ( ' /custom/path/to/pdftotext ' ))
-> setPdf ( ' book.pdf ' )
-> text ();
ou comme deuxième paramètre de la méthode statique getText
:
echo Pdf:: getText ( ' book.pdf ' , ' /custom/path/to/pdftotext ' );
Parfois, vous souhaiterez peut-être utiliser les options pdftotext. Pour ce faire, vous pouvez les configurer à l'aide de la méthode setOptions
.
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> text ()
;
ou comme troisième paramètre de la méthode statique getText
:
echo Pdf:: getText ( ' book.pdf ' , null , [ ' layout ' , ' opw myP1$$Word ' ]);
Veuillez noter que les appels successifs à setOptions()
écraseront les options transmises lors des appels précédents.
Si vous devez effectuer plusieurs appels pour ajouter des options (par exemple si vous devez transmettre les options par défaut lors de la création de l'objet Pdf
à partir d'un conteneur, puis ajouter des options spécifiques au contexte ailleurs), vous pouvez utiliser la méthode addOptions()
:
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> addOptions ([ ' f 1 ' ])
-> text ()
;
Veuillez consulter CHANGELOG pour plus d'informations sur ce qui a changé récemment.
composer test
Veuillez consulter CONTRIBUER pour plus de détails.
Si vous avez trouvé un bug concernant la sécurité, veuillez envoyer un mail à [email protected] au lieu d'utiliser le suivi des problèmes.
Spatie est une agence de webdesign basée à Anvers, en Belgique. Vous trouverez un aperçu de tous nos projets open source sur notre site Internet.
La licence MIT (MIT). Veuillez consulter le fichier de licence pour plus d'informations.