ansj_seg Unduh - ansj_seg Unduh kode sumber

ansj_seg

Kode sumber JAWA

ansj_seg

Unduh

Segmentasi kata Cina Ansj

Membantu

Dokumen pengembangan: versi 3.x dan sebelumnya, versi 5.x dan sesudahnya

ringkasan

Ini adalah implementasi Java dari segmentasi kata Cina berdasarkan n-Gram+CRF+HMM.

Kecepatan segmentasi kata mencapai sekitar 2 juta kata per detik (diuji di mac air), dan akurasinya bisa mencapai lebih dari 96%.

Saat ini, fungsi seperti segmentasi kata berbahasa Mandarin, pengenalan nama berbahasa Mandarin, kamus yang ditentukan pengguna, ekstraksi kata kunci, peringkasan otomatis, dan penandaan kata kunci telah diterapkan.

Ini dapat diterapkan pada pemrosesan bahasa alami dan aspek lainnya, dan cocok untuk berbagai proyek yang memerlukan efek segmentasi kata yang tinggi.

pakar

        
        <dependency>
            <groupId>org.ansj</groupId>
            <artifactId>ansj_seg</artifactId>
            <version>5.1.1</version>
        </dependency>

Panggil demo

Jika Anda mengunduh untuk pertama kalinya dan hanya ingin menguji efek pengujiannya, Anda dapat memanggil antarmuka sederhana ini


 String str = "欢迎使用ansj_seg,(ansj中文分词)在这里如果你遇到什么问题都可以联系我.我一定尽我所能.帮助大家.ansj_seg更快,更准,更自由!" ;
 System.out.println(ToAnalysis.parse(str));
 
 欢迎/v,使用/v,ansj/en,_,seg/en,,,(,ansj/en,中文/nz,分词/n,),在/p,这里/r,如果/c,你/r,遇到/v,什么/r,问题/n,都/d,可以/v,联系/v,我/r,./m,我/r,一定/d,尽我所能/l,./m,帮助/v,大家/r,./m,ansj/en,_,seg/en,更快/d,,,更/d,准/a,,,更/d,自由/a,!

Bergabunglah dengan Kami

Saya sudah memikirkannya sejak lama, tidak peduli apakah ada yang bisa membantu saya. Nanti saya tuliskan, jika berminat atau antusias bisa menghubungi saya.

Dokumentasi tambahan, menambahkan contoh dan instruksi panggilan
Tambahkan beberapa Pengakuan reguler, misalnya pengenalan nomor kartu ID, yang saat ini belum selesai termasuk时间识别, IP地址识别,邮箱识别,网址识别,词性识别, dll...
Berikan model CRF yang lebih optimal. Ganti model default ansj.
Kasus uji tambahan, pengujian tidak lengkap di banyak tempat. Jika Anda tertarik, Anda dapat membantu!
Rekonstruksi model pengenalan nama. Tambahkan model seperti pengenalan nama organisasi.
Tambahkan analisis sintaksis dan tata bahasa
Menerapkan metode segmentasi kata lstm
Isilah kekosongan...

Memperluas

Informasi Tambahan

Versi ansj_seg
Tipe Kode sumber JAWA
Waktu Pembaruan 2024-12-21
ukuran 24.14MB
Berasal dari Github

Aplikasi Terkait

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Anjing_Rubah_Kelinci

2022-08-01
Mesin analisis data Lihua versi gratis 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
redisson

Kode sumber JAWA

redisson-3.40.1
opentelemetry java instrumentation

Kode sumber JAWA

Version 2.10.0
PrettyZoo

Kode sumber JAWA

v2.1.1
waymo open dataset

Kode sumber lainnya

December 2023 Update
wp functions

Kategori lainnya

1.0.0
termwind

Kategori lainnya

v2.3.0

Informasi Terkait Semua