Este artículo describe el método de programación Java para extraer palabras clave del artículo. Compártelo para su referencia, como sigue:
Código de implementación:
/** * PAQUETES DE JAR RELACIONADOS * Lucene-Core-3.6.2.Jar, Lucene-Memory-3.6.2.Jar, * Lucene-Highlighter-3.6.2.Jar, Lucene-Analyzers-3.6.2.Jar * ikanalyzer2012 .JAR * * Interceptar palabras clave que aparecen con frecuencia en un artículo y les dan agrupación (flashback), devolviendo n palabras clave en formato de matriz * * Esta clase contiene un método list2map, que puede convertir las colecciones <tring> duplicadas. <String, Integer>* y calcule el número de repeticiones de <String> y colóquelo en el valor correspondiente*/paquete com.lifeix.api.util; importar java.util.arraylist; Entrada; */ public class Wordutil {/ ** Test Artículo*/ Palabra clave de cadena estática = "El comediante Pan Changjiang se ha convertido Actualizado por él el 13 de enero, se estrenó en Beijing TV. "Taiwán No. 1 Dilm Beauty 2" La historia de amor romántica de "Silk Countack" "+". Materiales "" Matchmaker "masculino" gira en torno a Ding Erchun y él "+" La agencia de matrimonio "Amor completo" se lanzó. Ding Erchunyan, que tiene mediana edad, parece que el creciente "matriz de matrimonio y amor" está constantemente en oportunidades de negocios, y quiere comenzar una carrera y vida con una boca inteligente. " +" La segunda primavera ". La agencia matrimonial se abrió bien y los clientes estaban llenos de gente, pero los requisitos eran todo tipo de extraños. Uno de los aspectos más destacados en la obra es la combinación de una mujer hermosa con un "hombre feo", y Zhang Ting y Pan Changjiang se convirtieron en un par de enemigos felices. Zhang Ting dijo que los dos en la obra "+" tienen una brecha en altura, una brecha en la edad y una apariencia desigual ". Cuando Pan Changjiang habló sobre este entorno de protagonista, creía que los roles anteriores de "Zhang Ting eran muy independientes y lindos, y" Big Woman "y" + "Little Man" son los escenarios de nuestra pareja, por lo que Zhang Ting es muy adecuado candidato. Pan Changjiang dijo que toda la obra muestra los diversos valores de matrimonio y amor en la sociedad contemporánea a través de la perspectiva de la profesión especial de "Matchmaker", que cubre muchos temas muy discutidos de los tiempos, como "+" Amor anual, oro- adorar a las mujeres y a los hombres de Phoenix. (Reportero Yin Chunfang) Descargo de responsabilidad: este artículo solo representa las opiniones personales del autor y no tiene nada que ver con Global Network. Su originalidad y las palabras y el contenido de la declaración "+" en el artículo no han sido verificados por este sitio web. y el texto. "; /** Obtenga el número de palabras clave* /privado final de Integer estático num = 5; /** Intercepe el número de palabras clave por encima de varias palabras* /cantidad privada de entero estático Cantidad = 1; /***Pase en tipos de cadena de Artículos, extraiga de manera inteligente las palabras en la lista * @param artículo * @param a * @return * @throws ioexception */ private static list <String> Extract (String Artículo, Integer a) TH ROWS IOException {List <String> List = New ArrayList <String> (); El método TokenStream (lea la secuencia de caracteres del artículo) Analyzer.tokenStream ("", New StringReader (artículo)); es char tokenStream.getAttribute (CharterMattribute.Class); Cantidad (predeterminada es más de 2 palabras) list.Add (Palabra de KEA); El valor predeterminado es 1 * @param list * @return */ private static map <string, integer> list2map (list <string> list) {map <string, integer> map = new Hashmap <Strin G, Integer> (); for (tecla de cadena: list) {// bucle-Obtained List set if (list.contains (key)) {// juzga si la cadena map.put (key, map.get (key) == NULL? 1: MAP .get (clave) +1); / ** * Método para extraer palabras clave * @param artículo * @param a * @param n * @return * @throws ioexception */ public static string [] getKeywords (string artículo, integ er a, entero n) lanza ioexception {list <String> KeywordSlist = Extract (artículo, a); Colecciones para que coincidan con la MA en el orden de valor de valor <Entrada <String, Integer >> list = new ArrayList <Entry <String, Integer >> (map.entryset ()); E prueba <String, Integer >> () {public int Compare (map.entry <string, integer> o1, map.entry <string, integer> o2) {return (o2.getValue () - o1.getValue ()) ; Para que la salida (int i = 0; i <list.size (); i ++) {// matriz después de la clasificación de bucle if (i <n) {// juzga el número de palabras clave [i] = list.get ( i) .getKey (); /Establezca palabras clave en una matriz}} return Palabras clave; return getKeywords (artículo, cantidad, num); ) {System.out.println (Palabras clave [i]);
Espero que este artículo sea útil para la programación Java de todos.