lenguaje-nlp
##MAVEN
<dependencies>
<dependency>
<groupId>org.nlpcn</groupId>
<artifactId>nlp-lang</artifactId>
<version>1.7.6</version>
</dependency>
</dependencies>
Este proyecto es un paquete básico que encapsula las herramientas más utilizadas en proyectos de PNL.
herramienta
- √ Estandarización de palabras
- √ estructura del árbol de neumáticos
- √ Árbol de neumáticos de doble matriz
- √ Segmentación de texto
- √ limpieza de etiquetas html
- √ Se agregó el algoritmo de Viterbi
componentes
- √ Convertir caracteres chinos a Pinyin
- √ Conversión entre chino simplificado y tradicional
- √ filtro de floración
- √ Deduplicación de huellas dactilares
- √ Cálculo de similitud de artículos de SimHash
- √ Estadísticas de coocurrencia de palabras
- √ Mensajes de búsqueda basados en la memoria
- √ Estadísticas de frecuencia de palabras de WordWeight, estadísticas de IDF de palabras, estadísticas de correlación de categorías de palabras