ไลบรารี Apache PDFBox เป็นเครื่องมือ Java แบบโอเพ่นซอร์สสำหรับการทำงานกับเอกสาร PDF โปรเจ็กต์นี้อนุญาตให้สร้างเอกสาร PDF ใหม่ จัดการเอกสารที่มีอยู่ และความสามารถในการแยกเนื้อหาออกจากเอกสาร PDFBox ยังมียูทิลิตี้บรรทัดคำสั่งหลายอย่าง PDFBox ได้รับการเผยแพร่ภายใต้ Apache License เวอร์ชัน 2.0
PDFBox เป็นโครงการของมูลนิธิซอฟต์แวร์ Apache
คุณสามารถดาวน์โหลดเวอร์ชันไบนารีสำหรับรุ่นที่กำลังอยู่ระหว่างการพัฒนาหรือรุ่นที่เก่ากว่าได้จากหน้าดาวน์โหลดของเรา
คุณต้องมี Java 11 (หรือสูงกว่า) และ Maven 3 เพื่อสร้าง PDFBox คำสั่ง build ที่แนะนำคือ:
mvn clean install
บิลด์เริ่มต้นจะคอมไพล์ซอร์ส Java และแพ็กเกจคลาสไบนารีเป็นแพ็กเกจ jar ดูเอกสารประกอบของ Maven สำหรับตัวเลือกบิลด์อื่นๆ ทั้งหมดที่มีอยู่
มีหลายวิธีในการช่วยเราปรับปรุง PDFBox
โปรดปฏิบัติตามหลักเกณฑ์ที่หน้าสนับสนุนของเรา
หากคุณมีคำถามเกี่ยวกับวิธีใช้ PDFBox โปรดสอบถามจากรายชื่อผู้รับจดหมายของผู้ใช้ สิ่งนี้จะช่วยให้คุณได้รับความช่วยเหลือจากชุมชนทั้งหมด
ตัวอย่าง PDFBox และโค้ดทดสอบในแหล่งที่มาจะให้ข้อมูลเพิ่มเติมด้วย
และมีแหล่งข้อมูลเพิ่มเติมบนเว็บไซต์ เช่น Stack Overflow
หากคุณแน่ใจว่าคุณพบจุดบกพร่อง โปรดรายงานปัญหาในตัวติดตามปัญหาของเรา
ดูตัวติดตามปัญหาเพื่อดูรายการปัญหาที่ทราบทั้งหมดและคุณสมบัติที่ร้องขอ ปัญหาที่พบบ่อยบางประการ ได้แก่:
คุณได้รับข้อความเช่น "G38G43G36G51G5" แทนที่จะเป็นข้อความที่คุณคาดหวังเมื่อแยกข้อความ เนื่องจากอักขระเป็นการเข้ารหัสภายในที่ไม่มีความหมายซึ่งชี้ไปที่สัญลักษณ์ที่ฝังอยู่ในเอกสาร PDF วิธีเดียวในการเข้าถึงข้อความคือใช้ OCR นี่อาจเป็นการปรับปรุงในอนาคต
คุณได้รับข้อความแสดงข้อผิดพลาดเช่น java.io.IOException: Can't handle font width
this อาจเนื่องมาจากข้อเท็จจริงที่ว่าคุณไม่มีไดเร็กทอรี org/apache/pdfbox/resources ใน classpath ของคุณ วิธีแก้ปัญหาที่ง่ายที่สุดคือการรวม apache-pdfbox-xxxjar ไว้ใน classpath ของคุณ
คุณได้รับข้อความที่มีอักขระที่ถูกต้องแต่อยู่ในลำดับที่ไม่ถูกต้อง อาจเป็นเพราะคุณไม่ได้เปิดใช้งานการเรียงลำดับ ข้อความในไฟล์ PDF จะถูกจัดเก็บเป็นส่วนๆ และไม่จำเป็นต้องจัดเก็บส่วนต่างๆ ตามลำดับที่แสดงบนหน้า ตามค่าเริ่มต้น PDFBox จะไม่เรียงลำดับข้อความ
งานโดยรวม: ลิขสิทธิ์ 2015 มูลนิธิซอฟต์แวร์ Apache
ได้รับอนุญาตให้ใช้งานกับ Apache Software Foundation (ASF) ภายใต้ข้อตกลงใบอนุญาตผู้มีส่วนร่วมตั้งแต่หนึ่งข้อตกลงขึ้นไป ดูไฟล์ประกาศที่แจกจ่ายพร้อมกับงานนี้สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการเป็นเจ้าของลิขสิทธิ์ ASF ให้สิทธิ์ใช้งานไฟล์นี้แก่คุณภายใต้ Apache License เวอร์ชัน 2.0 ("ใบอนุญาต"); คุณไม่สามารถใช้ไฟล์นี้ได้เว้นแต่จะเป็นไปตามใบอนุญาต คุณสามารถขอรับสำเนาใบอนุญาตได้ที่
https://www.apache.org/licenses/LICENSE-2.0
เว้นแต่กฎหมายที่ใช้บังคับกำหนดหรือตกลงเป็นลายลักษณ์อักษร ซอฟต์แวร์ที่เผยแพร่ภายใต้ใบอนุญาตนี้จะถูกแจกจ่าย "ตามที่เป็น" โดยไม่มีการรับประกันหรือเงื่อนไขใดๆ ทั้งโดยชัดแจ้งหรือโดยนัย ดูใบอนุญาตสำหรับภาษาเฉพาะที่ควบคุมการอนุญาตและข้อจำกัดภายใต้ใบอนุญาต
การแจกจ่ายนี้รวมถึงซอฟต์แวร์เข้ารหัสลับด้วย ประเทศที่คุณอาศัยอยู่ในปัจจุบันอาจมีข้อจำกัดในการนำเข้า ครอบครอง ใช้ และ/หรือส่งออกซ้ำไปยังประเทศอื่นของซอฟต์แวร์เข้ารหัส ก่อนที่จะใช้ซอฟต์แวร์เข้ารหัสใดๆ โปรดตรวจสอบกฎหมาย ข้อบังคับ และนโยบายของประเทศของคุณเกี่ยวกับการนำเข้า ครอบครอง หรือใช้ และส่งออกซอฟต์แวร์เข้ารหัสอีกครั้ง เพื่อดูว่าได้รับอนุญาตหรือไม่ ดู https://www.wassenaar.org/ สำหรับข้อมูลเพิ่มเติม
กระทรวงพาณิชย์ของรัฐบาลสหรัฐอเมริกา สำนักงานอุตสาหกรรมและความปลอดภัย (BIS) ได้จัดประเภทซอฟต์แวร์นี้เป็นหมายเลขควบคุมสินค้าส่งออก (ECCN) 5D002.C.1 ซึ่งรวมถึงซอฟต์แวร์รักษาความปลอดภัยข้อมูลที่ใช้หรือดำเนินการฟังก์ชันการเข้ารหัสด้วยอัลกอริธึมที่ไม่สมมาตร รูปแบบและลักษณะของการแจกจ่าย Apache Software Foundation นี้ทำให้มีสิทธิ์ในการส่งออกภายใต้ข้อยกเว้นใบอนุญาต ENC Technology Software Unrestricted (TSU) ข้อยกเว้น (ดู BIS Export Administration Rules, มาตรา 740.13) สำหรับทั้ง object code และ source code
ข้อมูลต่อไปนี้ให้รายละเอียดเพิ่มเติมเกี่ยวกับซอฟต์แวร์เข้ารหัสที่มีให้:
Apache PDFBox ใช้ Java Cryptography Architecture (JCA) และไลบรารี Bouncy Castle สำหรับจัดการการเข้ารหัสในเอกสาร PDF