ดาวน์โหลด ansj_seg - ดาวน์โหลดซอร์สโค้ด ansj

ansj_seg

ซอร์สโค้ด JAVA

ansj_seg

ดาวน์โหลด

Ansj การแบ่งคำภาษาจีน

ช่วย

เอกสารการพัฒนา: เวอร์ชัน 3.x และก่อนหน้า, เวอร์ชัน 5.x และหลังจากนั้น

สรุป

นี่เป็นการนำจาวาไปใช้ในการแบ่งส่วนคำภาษาจีนโดยยึดตาม n-Gram+CRF+HMM

ความเร็วในการแบ่งส่วนคำสูงถึงประมาณ 2 ล้านคำต่อวินาที (ทดสอบบน Mac Air) และความแม่นยำสามารถเข้าถึงได้มากกว่า 96%

ปัจจุบันมีการใช้ฟังก์ชันต่างๆ เช่น การแบ่งส่วนคำภาษาจีน การจดจำชื่อภาษาจีน พจนานุกรมที่ผู้ใช้กำหนด การแยกคำหลัก การสรุปอัตโนมัติ และการติดแท็กคำหลัก

สามารถนำไปใช้กับการประมวลผลภาษาธรรมชาติและด้านอื่นๆ และเหมาะสำหรับโปรเจ็กต์ต่างๆ ที่ต้องใช้เอฟเฟกต์การแบ่งส่วนคำในระดับสูง

มาเวน

        
        <dependency>
            <groupId>org.ansj</groupId>
            <artifactId>ansj_seg</artifactId>
            <version>5.1.1</version>
        </dependency>

โทรสาธิต

หากคุณดาวน์โหลดเป็นครั้งแรกและต้องการทดสอบผลการทดสอบ คุณสามารถเรียกอินเทอร์เฟซที่เรียบง่ายนี้ได้


 String str = "欢迎使用ansj_seg,(ansj中文分词)在这里如果你遇到什么问题都可以联系我.我一定尽我所能.帮助大家.ansj_seg更快,更准,更自由!" ;
 System.out.println(ToAnalysis.parse(str));
 
 欢迎/v,使用/v,ansj/en,_,seg/en,,,(,ansj/en,中文/nz,分词/n,),在/p,这里/r,如果/c,你/r,遇到/v,什么/r,问题/n,都/d,可以/v,联系/v,我/r,./m,我/r,一定/d,尽我所能/l,./m,帮助/v,大家/r,./m,ansj/en,_,seg/en,更快/d,,,更/d,准/a,,,更/d,自由/a,!

เข้าร่วมกับเรา

ฉันคิดเรื่องนี้มานานแล้วไม่ว่าจะมีใครช่วยฉันได้ก็ตาม ฉันจะเขียนมันลงไป หากคุณสนใจหรือกระตือรือร้น คุณสามารถติดต่อฉันได้

เอกสารประกอบเพิ่มเติม เพิ่มตัวอย่างการโทรและคำแนะนำ
เพิ่มการจดจำแบบปกติ เช่น การจดจำหมายเลขบัตรประจำตัวประชาชน ที่ยังดำเนินการไม่เสร็จในปัจจุบัน ได้แก่时间识别IP地址识别邮箱识别网址识别词性识别ฯลฯ...
จัดเตรียมโมเดล CRF ที่ได้รับการปรับปรุงให้เหมาะสมยิ่งขึ้น แทนที่โมเดลเริ่มต้นของ ansj
กรณีทดสอบเสริม การทดสอบที่ไม่สมบูรณ์ในหลายสถานที่ หากคุณสนใจสามารถช่วยได้!
สร้างแบบจำลองการจดจำชื่อขึ้นใหม่ เพิ่มโมเดล เช่น การจดจำชื่อองค์กร
เพิ่มการวิเคราะห์ไวยากรณ์และไวยากรณ์
ใช้วิธีการแบ่งส่วนคำของ lstm
เติมช่องว่าง...

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน ansj_seg
ประเภท ซอร์สโค้ด JAVA
เวลาอัปเดต 2024-12-21
ขนาด 24.14MB
มาจาก Github

แอปที่เกี่ยวข้อง

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
หมา_สุนัขจิ้งจอก_กระต่าย

2022-08-01
เครื่องมือวิเคราะห์ข้อมูล Lihua เวอร์ชันฟรี 3.0_search_navigation_collection_public comment_ranking_api

2022-06-28

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
redisson

ซอร์สโค้ด JAVA

redisson-3.40.1
opentelemetry java instrumentation

ซอร์สโค้ด JAVA

Version 2.10.0
PrettyZoo

ซอร์สโค้ด JAVA

v2.1.1
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
wp functions

หมวดหมู่อื่นๆ

1.0.0
termwind

หมวดหมู่อื่นๆ

v2.3.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด