ansj_seg
ansj_seg
นี่เป็นการนำจาวาไปใช้ในการแบ่งส่วนคำภาษาจีนโดยยึดตาม n-Gram+CRF+HMM
ความเร็วในการแบ่งส่วนคำสูงถึงประมาณ 2 ล้านคำต่อวินาที (ทดสอบบน Mac Air) และความแม่นยำสามารถเข้าถึงได้มากกว่า 96%
ปัจจุบันมีการใช้ฟังก์ชันต่างๆ เช่น การแบ่งส่วนคำภาษาจีน การจดจำชื่อภาษาจีน พจนานุกรมที่ผู้ใช้กำหนด การแยกคำหลัก การสรุปอัตโนมัติ และการติดแท็กคำหลัก
สามารถนำไปใช้กับการประมวลผลภาษาธรรมชาติและด้านอื่นๆ และเหมาะสำหรับโปรเจ็กต์ต่างๆ ที่ต้องใช้เอฟเฟกต์การแบ่งส่วนคำในระดับสูง
<dependency>
<groupId>org.ansj</groupId>
<artifactId>ansj_seg</artifactId>
<version>5.1.1</version>
</dependency>
หากคุณดาวน์โหลดเป็นครั้งแรกและต้องการทดสอบผลการทดสอบ คุณสามารถเรียกอินเทอร์เฟซที่เรียบง่ายนี้ได้
String str = "欢迎使用ansj_seg,(ansj中文分词)在这里如果你遇到什么问题都可以联系我.我一定尽我所能.帮助大家.ansj_seg更快,更准,更自由!" ;
System.out.println(ToAnalysis.parse(str));
欢迎/v,使用/v,ansj/en,_,seg/en,,,(,ansj/en,中文/nz,分词/n,),在/p,这里/r,如果/c,你/r,遇到/v,什么/r,问题/n,都/d,可以/v,联系/v,我/r,./m,我/r,一定/d,尽我所能/l,./m,帮助/v,大家/r,./m,ansj/en,_,seg/en,更快/d,,,更/d,准/a,,,更/d,自由/a,!
ฉันคิดเรื่องนี้มานานแล้วไม่ว่าจะมีใครช่วยฉันได้ก็ตาม ฉันจะเขียนมันลงไป หากคุณสนใจหรือกระตือรือร้น คุณสามารถติดต่อฉันได้
时间识别
IP地址识别
邮箱识别
网址识别
词性识别
ฯลฯ...