Apache POI ist die Open -Source -Funktionsbibliothek der Apache Software Foundation.
1. Lesen Sie das von Word 2003 und Word 2007 benötigte JAR -Paket
Das Lesen der WOD-Dateien von 2003 (.DOC) ist relativ einfach Ich sagte nicht, dass es, als wir den Code schrieben, problematischer war, mehr als 7 zu importieren.
1. OpenXML4J-BIN-Beta.jar
2. Poi-3.5-Beta6-20090622.jar
3.. Poi-ooxml-3.5-Beta6-20090622.jar
4.DOM4J-1.6.1.JAR
5.
6. Ooxml -Schemas -.0.jar
7. xmlbeans-2.3.0.jar
Unter ihnen ist 4-7 das JAR-Paket, das sich auf poi-ooxml-3,5-beta6-20090622.jar stützt (Sie finden sich im OOXML-Lib-Verzeichnis in Poi-BIN-3,5-Beta6-20090622.gz).
2. Symbol ändern
Hartschalter: Änderung in der Datei, wenn die "Eingabetaste" in der Tastatur verwendet wird.
Soft Switch: Die Anzahl der Zeichen in der Datei ist begrenzt.
Für Verfahren sind harte Austauschleitungen erkennbar und bestimmte Änderungen.
3. Vorsichtsmaßnahmen zum Lesen
Es ist erwähnenswert, dass: POI die Bildinformationen in der Wortdatei in Word -Datei nicht lesen. vorlesen.
4. Lesen Sie den Code des Wortes Textinhalt
Java.io.file; .OpenXML4J.OPCPACKAGE; = New WordExtractor (IS); Text2007 = extractor.getText ();