Download ansj_seg - download do código-fonte ansj

ansj_seg

Código fonte JAVA

ansj_seg

Baixar

Segmentação de palavras chinesas Ansj

Ajuda

Documentos de desenvolvimento: versão 3.xe anteriores, versão 5.xe posteriores

resumo

Esta é uma implementação java de segmentação de palavras chinesas baseada em n-Gram+CRF+HMM.

A velocidade de segmentação de palavras atinge cerca de 2 milhões de palavras por segundo (testado no mac air), e a precisão pode chegar a mais de 96%.

Atualmente, foram implementadas funções como segmentação de palavras chinesas, reconhecimento de nomes chineses, dicionários definidos pelo usuário, extração de palavras-chave, resumo automático e marcação de palavras-chave.

Pode ser aplicado ao processamento de linguagem natural e outros aspectos, e é adequado para diversos projetos que exigem altos efeitos de segmentação de palavras.

especialista

        
        <dependency>
            <groupId>org.ansj</groupId>
            <artifactId>ansj_seg</artifactId>
            <version>5.1.1</version>
        </dependency>

Chamada de demonstração

Se você baixa pela primeira vez e deseja apenas testar o efeito de teste, pode chamar esta interface simples


 String str = "欢迎使用ansj_seg,(ansj中文分词)在这里如果你遇到什么问题都可以联系我.我一定尽我所能.帮助大家.ansj_seg更快,更准,更自由!" ;
 System.out.println(ToAnalysis.parse(str));
 
 欢迎/v,使用/v,ansj/en,_,seg/en,,,(,ansj/en,中文/nz,分词/n,),在/p,这里/r,如果/c,你/r,遇到/v,什么/r,问题/n,都/d,可以/v,联系/v,我/r,./m,我/r,一定/d,尽我所能/l,./m,帮助/v,大家/r,./m,ansj/en,_,seg/en,更快/d,,,更/d,准/a,,,更/d,自由/a,!

Junte-se a nós

Estou pensando nisso há muito tempo, não importa se alguém possa me ajudar. Vou anotar. Se você estiver interessado ou entusiasmado, pode entrar em contato comigo.

Documentação complementar, adicionando exemplos e instruções de chamada
Adicione algum reconhecimento regular, por exemplo, reconhecimento de número de cartão de identificação, atualmente inacabado, incluindo时间识别, IP地址识别,邮箱识别,网址识别,词性识别, etc.
Forneça um modelo CRF mais otimizado. Substitua o modelo padrão do ansj.
Casos de teste complementares, testes incompletos em muitos lugares. Se você estiver interessado, você pode ajudar!
Reconstrua o modelo de reconhecimento de nomes. Adicione modelos como reconhecimento de nome de organização.
Adicione análise de sintaxe e gramática
Implementar o método de segmentação de palavras de lstm
Preencha as lacunas...

Expandir

Informações adicionais

Versão ansj_seg
Tipo Código fonte JAVA
Data da Última Atualização 2024-12-21
tamanho 24.14MB
Vindo de Github

Aplicativos Relacionados

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Cachorro_Fox_Coelho

2022-08-01
Mecanismo de análise de dados Lihua versão gratuita 3.0_search_navigation_collection_public parecer_ranking_api

2022-06-28

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
redisson

Código fonte JAVA

redisson-3.40.1
opentelemetry java instrumentation

Código fonte JAVA

Version 2.10.0
PrettyZoo

Código fonte JAVA

v2.1.1
waymo open dataset

Outro código-fonte

December 2023 Update
wp functions

Outras categorias

1.0.0
termwind

Outras categorias

v2.3.0

Informações Relacionadas Todos