ansj_segダウンロード - ansj_segソースコードのダウンロード

ansj_seg

JAVAソースコード

ansj_seg

ダウンロード

Ansj 中国語単語の分割

ヘルプ

開発ドキュメント: バージョン 3.x 以前、バージョン 5.x 以降

まとめ

これは、n-Gram+CRF+HMM に基づいた中国語単語分割の Java 実装です。

単語の分割速度は 1 秒あたり約 200 万単語 (Mac Air でテスト) に達し、精度は 96% 以上に達します。

現在、中国語単語分割、中国語名前認識、ユーザー定義辞書、キーワード抽出、自動要約、キーワードタグ付けなどの機能が実装されています。

自然言語処理などへの応用が可能で、高い単語分割効果が必要なさまざまなプロジェクトに適しています。

メイブン

        
        <dependency>
            <groupId>org.ansj</groupId>
            <artifactId>ansj_seg</artifactId>
            <version>5.1.1</version>
        </dependency>

通話デモ

初めてダウンロードし、テスト効果をテストしたいだけの場合は、このシンプルなインターフェイスを呼び出すことができます。


 String str = "欢迎使用ansj_seg,(ansj中文分词)在这里如果你遇到什么问题都可以联系我.我一定尽我所能.帮助大家.ansj_seg更快,更准,更自由!" ;
 System.out.println(ToAnalysis.parse(str));
 
 欢迎/v,使用/v,ansj/en,_,seg/en,,,(,ansj/en,中文/nz,分词/n,),在/p,这里/r,如果/c,你/r,遇到/v,什么/r,问题/n,都/d,可以/v,联系/v,我/r,./m,我/r,一定/d,尽我所能/l,./m,帮助/v,大家/r,./m,ansj/en,_,seg/en,更快/d,,,更/d,准/a,,,更/d,自由/a,!