Apache POI es la biblioteca de funciones de código abierto de la Fundación Apache Software.
1. Lea el paquete jar requerido por Word 2003 y Word 2007
Lectura de la versión 2003 (.DOC) WOD es relativamente simple. El problema dije que cuando escribimos el código, era más problemático importar.
1. OpenXml4j-bin-beta.jar
2. POI-3.5-BETA6-20090622.JAR
3. POI-OOXML-3.5-BETA6-20090622.JAR
4.dom4j-1.6.1.Jar
5.
6. OOXML -SCHEMAS -.0.JAR
7. XMLBeans-2.3.0.Jar
Entre ellos, 4-7 es el paquete JAR basado en POI-OOXML-3.5-BETA6-20090622.JAR (se puede encontrar en el directorio OOXML-LIB en POI-bin-3.5-beta6-20090622.gz).
2. Cambiar símbolo
Interruptor duro: cambie en el archivo, si el "Enter" se usa en el teclado.
Interruptor suave: el número de caracteres en el archivo es limitado.
Para los procedimientos, las líneas de intercambio duro son los cambios reconocibles y determinados.
3. Precauciones para la lectura
Vale la pena señalar que: POI no lee la información de la imagen en el archivo de Word en el archivo de Word; ser leído al final de la cadena.
4. Lea el código de contenido de texto de Word
Importar java.io.file; .Openxml4j.Opcpackage; = WordExtractor (IS); Text2007 = extractor.gettext ();