nlp-lang
##MAVEN
<dependencies>
<dependency>
<groupId>org.nlpcn</groupId>
<artifactId>nlp-lang</artifactId>
<version>1.7.6</version>
</dependency>
</dependencies>
Proyek ini adalah paket dasar. Ini merangkum alat yang paling umum digunakan dalam proyek nlp
alat
- √ Standarisasi kata
- √ struktur pohon ban
- √ Pohon ban susunan ganda
- √ Segmentasi teks
- √ pembersihan tag html
- √ Algoritma Viterbi ditambahkan
komponen
- √ Ubah karakter Cina menjadi Pinyin
- √ Konversi antara Bahasa Mandarin Sederhana dan Tradisional
- √ filter mekar
- √ Deduplikasi sidik jari
- √ Perhitungan kesamaan artikel SimHash
- √ Statistik kemunculan kata bersama
- √ Permintaan pencarian berbasis memori
- √ Statistik frekuensi kata WordWeight, statistik idf kata, statistik korelasi kategori kata