該套件提供了一個從 pdf 中提取文字的類別。
use Spatie PdfToText Pdf ;
echo Pdf:: getText ( ' book.pdf ' ); //returns the text from the pdf
Spatie 是一家位於比利時安特衛普的網頁設計公司。您可以在我們的網站上找到所有開源專案的概述。
我們投入了大量資源來創建一流的開源套件。您可以透過購買我們的一款付費產品來支持我們。
我們非常感謝您從家鄉寄給我們一張明信片,並註明您正在使用我們的哪種套餐。您可以在我們的聯絡頁面上找到我們的地址。我們在虛擬明信片牆上發布所有收到的明信片。
該包在幕後利用了 pdftotext。您可以透過發出以下命令來驗證系統上是否安裝了二進位檔案:
which pdftotext
如果已安裝,它將返回二進位檔案的路徑。
要安裝二進位文件,您可以在 Ubuntu 或 Debian 上使用以下命令:
apt-get install poppler-utils
在 Mac 上,您可以使用brew 安裝二進位文件
brew install poppler
如果您使用的是 RedHat、CentOS、Rocky Linux 或 Fedora,請使用以下命令:
yum install poppler-utils
您可以透過 Composer 安裝該軟體包:
composer require spatie/pdf-to-text
從 pdf 中提取文字很容易。
$ text = ( new Pdf ())
-> setPdf ( ' book.pdf ' )
-> text ();
或更簡單:
echo Pdf:: getText ( ' book.pdf ' );
預設情況下,該套件將假定pdftotext
指令位於/usr/bin/pdftotext
。如果它位於其他地方,則將其二進位路徑傳遞給建構函數
$ text = ( new Pdf ( ' /custom/path/to/pdftotext ' ))
-> setPdf ( ' book.pdf ' )
-> text ();
或作為getText
靜態方法的第二個參數:
echo Pdf:: getText ( ' book.pdf ' , ' /custom/path/to/pdftotext ' );
有時您可能想要使用 pdftotext 選項。為此,您可以使用setOptions
方法來設定它們。
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> text ()
;
或作為getText
靜態方法的第三個參數:
echo Pdf:: getText ( ' book.pdf ' , null , [ ' layout ' , ' opw myP1$$Word ' ]);
請注意,連續呼叫setOptions()
將覆寫先前呼叫期間傳入的選項。
如果您需要多次呼叫來新增選項(例如,如果您需要在從容器建立Pdf
物件時傳入預設選項,然後在其他地方新增上下文特定的選項),您可以使用addOptions()
方法:
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> addOptions ([ ' f 1 ' ])
-> text ()
;
請參閱變更日誌以了解有關最近更改內容的更多資訊。
composer test
詳細資訊請參閱貢獻。
如果您發現有關安全的錯誤,請發送郵件至 [email protected],而不是使用問題追蹤器。
Spatie 是一家位於比利時安特衛普的網頁設計公司。您可以在我們的網站上找到所有開源專案的概述。
麻省理工學院許可證 (MIT)。請參閱許可證文件以獲取更多資訊。