nlp-lang
##MAVEN
<dependencies>
<dependency>
<groupId>org.nlpcn</groupId>
<artifactId>nlp-lang</artifactId>
<version>1.7.6</version>
</dependency>
</dependencies>
Este projeto é um pacote básico. Ele encapsula as ferramentas mais comuns em projetos de PNL.
ferramenta
- √ Padronização de palavras
- √ estrutura da árvore do pneu
- √ Árvore de pneus de matriz dupla
- √ Segmentação de texto
- √ limpeza de tags html
- √ Algoritmo de Viterbi adicionado
componentes
- √ Converter caracteres chineses em Pinyin
- √ Conversão entre chinês simplificado e tradicional
- √ filtro de flores
- √ Desduplicação de impressão digital
- √ Cálculo de similaridade de artigos SimHash
- √ Estatísticas de coocorrência de palavras
- √ Solicitações de pesquisa baseadas em memória
- √ Estatísticas de frequência de palavras WordWeight, estatísticas de idf de palavras, estatísticas de correlação de categoria de palavras