IKAnalyzer เป็นชุดเครื่องมือแบ่งคำภาษาจีนแบบโอเพ่นซอร์สน้ำหนักเบาที่พัฒนาขึ้นโดยใช้ภาษา Java นับตั้งแต่เปิดตัวเวอร์ชัน 1.0 ในเดือนธันวาคม พ.ศ. 2549 IKAnalyzer ได้เปิดตัวเวอร์ชันหลัก 4 เวอร์ชัน ในตอนแรก มันเป็นองค์ประกอบการแบ่งส่วนคำภาษาจีนตามโครงการโอเพ่นซอร์ส Luence ซึ่งรวมการแบ่งส่วนคำในพจนานุกรมและอัลกอริธึมการวิเคราะห์ไวยากรณ์ เริ่มตั้งแต่เวอร์ชัน 3.0 IK ได้พัฒนาเป็นส่วนประกอบการแบ่งส่วนคำสาธารณะสำหรับ Java โดยไม่ขึ้นอยู่กับโปรเจ็กต์ Lucene และจัดเตรียมการใช้งาน Lucene ที่ปรับให้เหมาะสมตามค่าเริ่มต้น ในเวอร์ชันปี 2012 IK ได้ใช้อัลกอริธึมการกำจัดความคลุมเครือของการแบ่งส่วนคำอย่างง่าย ซึ่งถือเป็นวิวัฒนาการของการแบ่งส่วนคำของ IK ตั้งแต่การแบ่งส่วนพจนานุกรมอย่างง่ายไปจนถึงการจำลองการแบ่งส่วนคำเชิงความหมาย
คุณสมบัติ IKAnalyzer2012:
ใช้ "การวนซ้ำไปข้างหน้าของอัลกอริธึมการแบ่งส่วนแบบละเอียดที่สุด" ที่เป็นเอกลักษณ์ และรองรับโหมดการแบ่งส่วน 2 โหมด ได้แก่ การแบ่งส่วนคำแบบละเอียดและแบบอัจฉริยะ
ในสภาพแวดล้อมของระบบ: Core2i73.4G dual-core, หน่วยความจำ 4G, window764-bit, SunJDK1.6_2964-bit การทดสอบสภาพแวดล้อมพีซีธรรมดา IK2012 มีความสามารถในการประมวลผลความเร็วสูง 1.6 ล้านคำ/วินาที (3000KB/S)
โหมดการแบ่งส่วนคำอัจฉริยะเวอร์ชันปี 2012 รองรับการประมวลผลการแยกส่วนคำแบบง่ายๆ และเอาต์พุตการรวมตัวระบุปริมาณ
ใช้โหมดการวิเคราะห์โปรเซสเซอร์ย่อยหลายตัว รองรับ: การประมวลผลการแบ่งส่วนคำของตัวอักษรภาษาอังกฤษ ตัวเลข คำศัพท์ภาษาจีน ฯลฯ เข้ากันได้กับพื้นที่จัดเก็บพจนานุกรมที่ปรับให้เหมาะสมกับอักขระภาษาเกาหลีและญี่ปุ่น และมีปริมาณหน่วยความจำที่เล็กลง รองรับคำจำกัดความเพิ่มเติมของพจนานุกรมผู้ใช้ โดยเฉพาะอย่างยิ่งในเวอร์ชัน 2012 พจนานุกรมรองรับคำผสมภาษาจีน อังกฤษ และดิจิทัล