Apache POI adalah pustaka fungsi open source dari Apache Software Foundation.
1. Baca paket JAR yang disyaratkan oleh Word 2003 dan Word 2007
Membaca file WOD versi 2003 (.doc) relatif sederhana Masalah yang saya katakan bukanlah ketika kami menulis kode, itu lebih merepotkan untuk diimpor.
1. OpenXML4J-BIN-BETA.JAR
2. POI-3.5-Beta6-20090622.jar
3. Poi-ooxml-3.5-beta6-20090622.jar
4.dom4j-1.6.1.jar
5.
6. OOXML -SCHEMAS -.0.JAR
7. XMLBeans-2.3.0.jar
Di antara mereka, 4-7 adalah paket JAR yang diandalkan pada poi-ooxml-3.5-beta6-20090622.jar (Anda dapat ditemukan di direktori ooxml-lib di poi-bin-3.5-beta6-20090622.gz).
2. Ubah Simbol
Hard Switch: Ubah file, jika "Enter" digunakan di keyboard.
Soft Switch: Jumlah karakter dalam file terbatas.
Untuk prosedur, garis pertukaran keras dapat dikenali dan perubahan yang ditentukan.
3. tindakan pencegahan untuk membaca
Perlu dicatat bahwa: POI tidak membaca informasi gambar dalam file Word dalam Word; Bacalah.
4. Baca Kode Konten Teks Kata
Impor Java.io.file; .openxml4j.opcpackage; = WordExtractor (IS); Text2007 = extractor.getText ();} catch (Exception e) {e.printstacktrace ();}}}