Este pacote fornece uma classe para extrair texto de um PDF.
use Spatie PdfToText Pdf ;
echo Pdf:: getText ( ' book.pdf ' ); //returns the text from the pdf
Spatie é uma agência de webdesign com sede em Antuérpia, Bélgica. Você encontrará uma visão geral de todos os nossos projetos de código aberto em nosso site.
Investimos muitos recursos na criação dos melhores pacotes de código aberto. Você pode nos apoiar comprando um de nossos produtos pagos.
Agradecemos muito que você nos envie um cartão postal de sua cidade natal, mencionando qual(is) de nossos pacotes você está usando. Você encontrará nosso endereço em nossa página de contato. Publicamos todos os cartões postais recebidos em nosso mural virtual de cartões postais.
Nos bastidores, este pacote utiliza o pdftotext. Você pode verificar se o binário está instalado em seu sistema emitindo este comando:
which pdftotext
Se estiver instalado, retornará o caminho para o binário.
Para instalar o binário você pode usar este comando no Ubuntu ou Debian:
apt-get install poppler-utils
Em um Mac você pode instalar o binário usando brew
brew install poppler
Se você estiver no RedHat, CentOS, Rocky Linux ou Fedora, use isto:
yum install poppler-utils
Você pode instalar o pacote via compositor:
composer require spatie/pdf-to-text
Extrair texto de um PDF é fácil.
$ text = ( new Pdf ())
-> setPdf ( ' book.pdf ' )
-> text ();
Ou mais fácil:
echo Pdf:: getText ( ' book.pdf ' );
Por padrão, o pacote assumirá que o comando pdftotext
está localizado em /usr/bin/pdftotext
. Se estiver localizado em outro lugar, passe seu caminho binário para o construtor
$ text = ( new Pdf ( ' /custom/path/to/pdftotext ' ))
-> setPdf ( ' book.pdf ' )
-> text ();
ou como segundo parâmetro do método estático getText
:
echo Pdf:: getText ( ' book.pdf ' , ' /custom/path/to/pdftotext ' );
Às vezes você pode querer usar opções de pdftotext. Para fazer isso, você pode configurá-los usando o método setOptions
.
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> text ()
;
ou como terceiro parâmetro do método estático getText
:
echo Pdf:: getText ( ' book.pdf ' , null , [ ' layout ' , ' opw myP1$$Word ' ]);
Observe que chamadas sucessivas para setOptions()
substituirão as opções passadas durante chamadas anteriores.
Se você precisar fazer várias chamadas para adicionar opções (por exemplo, se precisar passar opções padrão ao criar o objeto Pdf
a partir de um contêiner e, em seguida, adicionar opções específicas de contexto em outro lugar), você pode usar o método addOptions()
:
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> addOptions ([ ' f 1 ' ])
-> text ()
;
Consulte CHANGELOG para obter mais informações sobre o que mudou recentemente.
composer test
Consulte CONTRIBUINDO para obter detalhes.
Se você encontrou um bug relacionado à segurança, envie um email para [email protected] em vez de usar o rastreador de problemas.
Spatie é uma agência de webdesign com sede em Antuérpia, Bélgica. Você encontrará uma visão geral de todos os nossos projetos de código aberto em nosso site.
A licença MIT (MIT). Consulte Arquivo de licença para obter mais informações.