nlp-lang
##MAVEN
<dependencies>
<dependency>
<groupId>org.nlpcn</groupId>
<artifactId>nlp-lang</artifactId>
<version>1.7.6</version>
</dependency>
</dependencies>
Ce projet est un package de base. Il encapsule les outils les plus courants dans les projets NLP.
outil
- √ Standardisation des mots
- √ arborescence des pneus
- √ Arbre à pneus à double rangée
- √ Segmentation du texte
- √ nettoyage des balises html
- √ Algorithme de Viterbi ajouté
composants
- √ Convertir les caractères chinois en Pinyin
- √ Conversion entre le chinois simplifié et le chinois traditionnel
- √ filtre bloom
- √ Déduplication d'empreintes digitales
- √ Calcul de similarité des articles SimHash
- √ Statistiques de cooccurrence de mots
- √ Invites de recherche basées sur la mémoire
- √ Statistiques de fréquence des mots WordWeight, statistiques d'identification des mots, statistiques de corrélation des catégories de mots