Apache Poi เป็นไลบรารีฟังก์ชั่นโอเพ่นซอร์สของ Apache Software Foundation
1. อ่านแพ็คเกจ JAR ที่ต้องการโดย Word 2003 และ Word 2007
การอ่านไฟล์ WOD รุ่น 2003 (.DOC) นั้นค่อนข้างง่าย ปัญหาที่ฉันบอกว่าเมื่อเราเขียนรหัสมันเป็นเรื่องยากมากที่จะนำเข้า
1. openxml4j-bin-beta.jar
2. POI-3.5-beta6-20090622.jar
3. poi-ooxml-3.5-beta6-20090622.jar
4.dom4j-1.6.1.jar
5.
6. ooxml -schemas -.0.jar
7. XMLBEANS-2.3.0.JAR
ในหมู่พวกเขา 4-7 คือแพ็คเกจ JAR ที่อาศัยอยู่ใน poi-ooxml-3.5-beta6-20090622.jar (คุณสามารถพบได้ในไดเรกทอรี ooxml-lib ใน poi-bin-3.5-beta6-20090622.gz)
2. เปลี่ยนสัญลักษณ์
ฮาร์ดสวิตช์: เปลี่ยนไฟล์หากใช้ "Enter" ในแป้นพิมพ์
Soft Switch: จำนวนอักขระในไฟล์มี จำกัด
สำหรับขั้นตอนการแลกเปลี่ยนที่ยากลำบากและการเปลี่ยนแปลงที่กำหนด
3. ข้อควรระวังสำหรับการอ่าน
เป็นที่น่าสังเกตว่า: POI ไม่ได้อ่านข้อมูลรูปภาพในไฟล์คำในไฟล์ Word; อ่านออกมาในตอนท้ายของสตริง
4. อ่านรหัสเนื้อหาข้อความ Word
นำเข้า Java.io.File; .Openxml4j.opcpackage; นำเข้า org.apache.poi.xwpf.extractor.xwpfordextractor; = New WordExtractor (IS); text2007 = extractor.getText ();