Этот пакет предоставляет класс для извлечения текста из PDF-файла.
use Spatie PdfToText Pdf ;
echo Pdf:: getText ( ' book.pdf ' ); //returns the text from the pdf
Spatie — агентство веб-дизайна, базирующееся в Антверпене, Бельгия. На нашем сайте вы найдете обзор всех наших проектов с открытым исходным кодом.
Мы вкладываем много ресурсов в создание лучших в своем классе пакетов с открытым исходным кодом. Вы можете поддержать нас, купив один из наших платных продуктов.
Мы очень признательны вам за отправку нам открытки из вашего родного города с указанием того, какой из наших пакетов вы используете. Наш адрес вы найдете на странице контактов. Все полученные открытки мы публикуем на нашей виртуальной стене открыток.
За кулисами этот пакет использует pdftotext. Вы можете проверить, установлен ли двоичный файл в вашей системе, выполнив следующую команду:
which pdftotext
Если он установлен, он вернет путь к двоичному файлу.
Чтобы установить двоичный файл, вы можете использовать эту команду в Ubuntu или Debian:
apt-get install poppler-utils
На Mac вы можете установить двоичный файл с помощью Brew.
brew install poppler
Если вы используете RedHat, CentOS, Rocky Linux или Fedora, используйте это:
yum install poppler-utils
Вы можете установить пакет через композитор:
composer require spatie/pdf-to-text
Извлечь текст из PDF-файла легко.
$ text = ( new Pdf ())
-> setPdf ( ' book.pdf ' )
-> text ();
Или проще:
echo Pdf:: getText ( ' book.pdf ' );
По умолчанию пакет предполагает, что команда pdftotext
находится в /usr/bin/pdftotext
. Если он находится в другом месте, передайте его двоичный путь конструктору.
$ text = ( new Pdf ( ' /custom/path/to/pdftotext ' ))
-> setPdf ( ' book.pdf ' )
-> text ();
или в качестве второго параметра статического метода getText
:
echo Pdf:: getText ( ' book.pdf ' , ' /custom/path/to/pdftotext ' );
Иногда вам может потребоваться использовать параметры pdftotext. Для этого вы можете настроить их с помощью метода setOptions
.
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> text ()
;
или в качестве третьего параметра статического метода getText
:
echo Pdf:: getText ( ' book.pdf ' , null , [ ' layout ' , ' opw myP1$$Word ' ]);
Обратите внимание, что последующие вызовы setOptions()
перезапишут параметры, переданные во время предыдущих вызовов.
Если вам нужно выполнить несколько вызовов для добавления параметров (например, если вам нужно передать параметры по умолчанию при создании объекта Pdf
из контейнера, а затем добавить контекстно-зависимые параметры в другом месте), вы можете использовать метод addOptions()
:
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> addOptions ([ ' f 1 ' ])
-> text ()
;
Пожалуйста, посетите CHANGELOG для получения дополнительной информации о том, что изменилось за последнее время.
composer test
Пожалуйста, смотрите ВКЛАД для получения подробной информации.
Если вы обнаружили ошибку, связанную с безопасностью, отправьте электронное письмо по адресу [email protected] вместо использования системы отслеживания проблем.
Spatie — агентство веб-дизайна, базирующееся в Антверпене, Бельгия. На нашем сайте вы найдете обзор всех наших проектов с открытым исходным кодом.
Лицензия MIT (MIT). Пожалуйста, смотрите файл лицензии для получения дополнительной информации.