แพ็คเกจนี้มีคลาสเพื่อแยกข้อความจากไฟล์ PDF
use Spatie PdfToText Pdf ;
echo Pdf:: getText ( ' book.pdf ' ); //returns the text from the pdf
Spatie เป็นเอเจนซี่ออกแบบเว็บไซต์ที่ตั้งอยู่ในเมืองแอนต์เวิร์ป ประเทศเบลเยียม คุณจะพบภาพรวมของโครงการโอเพ่นซอร์สทั้งหมดของเราบนเว็บไซต์ของเรา
เราลงทุนทรัพยากรจำนวนมากเพื่อสร้างแพ็คเกจโอเพ่นซอร์สที่ดีที่สุดในระดับเดียวกัน คุณสามารถสนับสนุนเราได้โดยการซื้อหนึ่งในผลิตภัณฑ์ที่ต้องชำระเงินของเรา
เราขอขอบคุณอย่างยิ่งที่คุณส่งโปสการ์ดจากบ้านเกิดของคุณถึงเรา โดยระบุว่าคุณใช้แพ็คเกจใดของเรา คุณจะพบที่อยู่ของเราในหน้าติดต่อของเรา เราเผยแพร่โปสการ์ดที่ได้รับทั้งหมดบนวอลล์โปสการ์ดเสมือนของเรา
เบื้องหลังแพ็คเกจนี้ใช้ประโยชน์จาก pdftotext คุณสามารถตรวจสอบว่าไบนารีติดตั้งอยู่ในระบบของคุณหรือไม่โดยออกคำสั่งนี้:
which pdftotext
หากติดตั้งแล้วจะคืนเส้นทางไปยังไบนารี่
หากต้องการติดตั้งไบนารีคุณสามารถใช้คำสั่งนี้บน Ubuntu หรือ Debian:
apt-get install poppler-utils
บน Mac คุณสามารถติดตั้งไบนารี่โดยใช้ Brew
brew install poppler
หากคุณใช้ RedHat, CentOS, Rocky Linux หรือ Fedora ให้ใช้สิ่งนี้:
yum install poppler-utils
คุณสามารถติดตั้งแพ็คเกจผ่านทางผู้แต่ง:
composer require spatie/pdf-to-text
การแยกข้อความจาก pdf เป็นเรื่องง่าย
$ text = ( new Pdf ())
-> setPdf ( ' book.pdf ' )
-> text ();
หรือง่ายกว่า:
echo Pdf:: getText ( ' book.pdf ' );
ตามค่าเริ่มต้น แพ็คเกจจะถือว่าคำสั่ง pdftotext
อยู่ที่ /usr/bin/pdftotext
หากตั้งอยู่ที่อื่นให้ส่งเส้นทางไบนารี่ไปยังตัวสร้าง
$ text = ( new Pdf ( ' /custom/path/to/pdftotext ' ))
-> setPdf ( ' book.pdf ' )
-> text ();
หรือเป็นพารามิเตอร์ตัวที่สองของเมธอด getText
static:
echo Pdf:: getText ( ' book.pdf ' , ' /custom/path/to/pdftotext ' );
บางครั้งคุณอาจต้องการใช้ตัวเลือก pdftotext โดยคุณสามารถตั้งค่าได้โดยใช้เมธอด setOptions
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> text ()
;
หรือเป็นพารามิเตอร์ตัวที่สามของเมธอด getText
static:
echo Pdf:: getText ( ' book.pdf ' , null , [ ' layout ' , ' opw myP1$$Word ' ]);
โปรดทราบว่าการเรียก setOptions()
อย่างต่อเนื่องจะเขียนทับตัวเลือกที่ส่งเข้ามาระหว่างการโทรครั้งก่อน
หากคุณต้องการทำการเรียกหลายครั้งเพื่อเพิ่มตัวเลือก (เช่น หากคุณต้องการส่งตัวเลือกเริ่มต้นเมื่อสร้างออบเจ็กต์ Pdf
จากคอนเทนเนอร์ จากนั้นเพิ่มตัวเลือกเฉพาะบริบทที่อื่น) คุณสามารถใช้เมธอด addOptions()
ได้:
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> addOptions ([ ' f 1 ' ])
-> text ()
;
โปรดดู CHANGELOG สำหรับข้อมูลเพิ่มเติมเกี่ยวกับสิ่งที่เปลี่ยนแปลงเมื่อเร็วๆ นี้
composer test
โปรดดูการมีส่วนร่วมเพื่อดูรายละเอียด
หากคุณพบข้อบกพร่องเกี่ยวกับการรักษาความปลอดภัย โปรดส่งอีเมลไปที่ [email protected] แทนการใช้ตัวติดตามปัญหา
Spatie เป็นเอเจนซี่ออกแบบเว็บไซต์ที่ตั้งอยู่ในเมืองแอนต์เวิร์ป ประเทศเบลเยียม คุณจะพบภาพรวมของโครงการโอเพ่นซอร์สทั้งหมดของเราบนเว็บไซต์ของเรา
ใบอนุญาตเอ็มไอที (MIT) โปรดดูไฟล์ใบอนุญาตสำหรับข้อมูลเพิ่มเติม