nlp-lang
##MAVEN
<dependencies>
<dependency>
<groupId>org.nlpcn</groupId>
<artifactId>nlp-lang</artifactId>
<version>1.7.6</version>
</dependency>
</dependencies>
Dieses Projekt ist ein Basispaket. Es kapselt die gängigsten Tools in NLP-Projekten
Werkzeug
- √ Wortstandardisierung
- √ Reifenbaumstruktur
- √ Reifenbaum mit doppelter Anordnung
- √ Textsegmentierung
- √ HTML-Tag-Bereinigung
- √ Viterbi-Algorithmus hinzugefügt
Komponenten
- √ Konvertieren Sie chinesische Schriftzeichen in Pinyin
- √ Konvertierung zwischen vereinfachtem und traditionellem Chinesisch
- √ Blütenfilter
- √ Deduplizierung von Fingerabdrücken
- √ SimHash-Artikelähnlichkeitsberechnung
- √ Statistiken zum gleichzeitigen Vorkommen von Wörtern
- √ Speicherbasierte Suchaufforderungen
- √ WordWeight-Worthäufigkeitsstatistik, Wort-IDF-Statistik, Wortkategorie-Korrelationsstatistik