Este paquete proporciona una clase para extraer texto de un pdf.
use Spatie PdfToText Pdf ;
echo Pdf:: getText ( ' book.pdf ' ); //returns the text from the pdf
Spatie es una agencia de diseño web con sede en Amberes, Bélgica. Encontrará una descripción general de todos nuestros proyectos de código abierto en nuestro sitio web.
Invertimos muchos recursos en la creación de los mejores paquetes de código abierto. Puedes apoyarnos comprando uno de nuestros productos pagos.
Agradecemos mucho que nos envíe una postal desde su ciudad natal, mencionando cuál de nuestros paquetes está utilizando. Encontrarás nuestra dirección en nuestra página de contacto. Publicamos todas las postales recibidas en nuestro muro virtual de postales.
Detrás de escena, este paquete aprovecha pdftotext. Puede verificar si el binario está instalado en su sistema emitiendo este comando:
which pdftotext
Si está instalado, devolverá la ruta al binario.
Para instalar el binario puedes usar este comando en Ubuntu o Debian:
apt-get install poppler-utils
En una Mac puedes instalar el binario usando Brew.
brew install poppler
Si estás en RedHat, CentOS, Rocky Linux o Fedora usa esto:
yum install poppler-utils
Puede instalar el paquete a través del compositor:
composer require spatie/pdf-to-text
Extraer texto de un pdf es fácil.
$ text = ( new Pdf ())
-> setPdf ( ' book.pdf ' )
-> text ();
O más fácil:
echo Pdf:: getText ( ' book.pdf ' );
De forma predeterminada, el paquete asumirá que el comando pdftotext
se encuentra en /usr/bin/pdftotext
. Si está ubicado en otro lugar, pase su ruta binaria al constructor.
$ text = ( new Pdf ( ' /custom/path/to/pdftotext ' ))
-> setPdf ( ' book.pdf ' )
-> text ();
o como segundo parámetro del método estático getText
:
echo Pdf:: getText ( ' book.pdf ' , ' /custom/path/to/pdftotext ' );
A veces es posible que desee utilizar las opciones de pdf a texto. Para hacerlo, puede configurarlos utilizando el método setOptions
.
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> text ()
;
o como tercer parámetro del método estático getText
:
echo Pdf:: getText ( ' book.pdf ' , null , [ ' layout ' , ' opw myP1$$Word ' ]);
Tenga en cuenta que las llamadas sucesivas a setOptions()
sobrescribirán las opciones pasadas durante llamadas anteriores.
Si necesita realizar varias llamadas para agregar opciones (por ejemplo, si necesita pasar opciones predeterminadas al crear el objeto Pdf
desde un contenedor y luego agregar opciones específicas del contexto en otro lugar), puede usar el método addOptions()
:
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> addOptions ([ ' f 1 ' ])
-> text ()
;
Consulte CHANGELOG para obtener más información sobre los cambios recientes.
composer test
Consulte CONTRIBUCIÓN para obtener más detalles.
Si encuentra un error relacionado con la seguridad, envíe un correo electrónico a [email protected] en lugar de utilizar el rastreador de problemas.
Spatie es una agencia de diseño web con sede en Amberes, Bélgica. Encontrará una descripción general de todos nuestros proyectos de código abierto en nuestro sitio web.
La Licencia MIT (MIT). Consulte el archivo de licencia para obtener más información.