تنزيل PDFLayoutTextStripper - تنزيل كود مصدر PDFLayoutTextStripper

PDFLayoutTextStripper

جافا كود المصدر

v2.2.5

تنزيل

PDFLayoutTextStripper

يحول ملف PDF إلى ملف نصي مع الحفاظ على تخطيط ملف PDF الأصلي. مفيد لاستخراج المحتوى من جدول أو نموذج في ملف PDF. PDFLayoutTextStripper هي فئة فرعية من فئة PDFTextStripper (من مكتبة Apache PDFBox).

حالات الاستخدام

استخراج البيانات من جدول في ملف PDF

استخراج البيانات من نموذج في ملف PDF مثال

كيفية التثبيت

مخضرم

 <dependency>
  <groupId>io.github.jonathanlink</groupId>
  <artifactId>PDFLayoutTextStripper</artifactId>
  <version>2.2.3</version>
</dependency>

يدوي

قم بتثبيت Apache pdfbox يدويًا (للحصول على الإصدار 2.0.6 انقر هنا) وتبعيتيه commons-logging.jar وfontbox

تحذير : إصدارات pdfbox فقط من الإصدار 2.0.0 وما فوق متوافقة مع هذا الإصدار من PDFLayoutTextStripper.java

كيفية الاستخدام على Linux/Mac

 cd PDFLayoutTextStripper
javac -cp .:/pathto/pdfbox-2.0.6.jar:/pathto/commons-logging-1.2.jar:/pathto/PDFLayoutTextStripper/fontbox-2.0.6.jar *.java
java -cp .:/pathto/pdfbox-2.0.6.jar:/pathto/commons-logging-1.2.jar:/pathto/PDFLayoutTextStripper/fontbox-2.0.6.jar test

كيفية الاستخدام على نظام التشغيل Windows

نفس الشيء بالنسبة لنظام Linux (انظر أعلاه) ولكن استبدل : بـ ؛

رمز العينة

 import java.io.File;
import java.io.FileNotFoundException;
import java.io.IOException;
import org.apache.pdfbox.io.RandomAccessFile;
import org.apache.pdfbox.pdfparser.PDFParser;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;

public class test {
	public static void main(String[] args) {
		String string = null;
        try {
            PDFParser pdfParser = new PDFParser(new RandomAccessFile(new File("./samples/bus.pdf"), "r"));
            pdfParser.parse();
            PDDocument pdDocument = new PDDocument(pdfParser.getDocument());
            PDFTextStripper pdfTextStripper = new PDFLayoutTextStripper();
            string = pdfTextStripper.getText(pdDocument);
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        };
        System.out.println(string);
	}
}