IKAnalyzer عبارة عن مجموعة أدوات مفتوحة المصدر وخفيفة الوزن لتجزئة الكلمات الصينية تم تطويرها استنادًا إلى لغة Java. منذ إطلاق الإصدار 1.0 في ديسمبر 2006، أطلقت IKAnalyzer 4 إصدارات رئيسية. في البداية، كان مكونًا لتجزئة الكلمات الصينية يعتمد على مشروع مفتوح المصدر Luence، والذي يجمع بين تجزئة الكلمات القاموسية وخوارزميات التحليل النحوي. بدءًا من الإصدار 3.0، تطور IK ليصبح مكونًا عامًا لتجزئة الكلمات لـ Java، بشكل مستقل عن مشروع Lucene، ويوفر تطبيقًا افتراضيًا محسنًا لـ Lucene. في إصدار 2012، نفذت IK خوارزمية بسيطة لإزالة الغموض في تجزئة الكلمات، مما يشير إلى تطور أداة تجزئة الكلمات IK من تجزئة القاموس البسيطة إلى محاكاة تجزئة الكلمات الدلالية.
ميزات IKAnalyzer2012:
إنها تتبنى "تكرارًا أماميًا فريدًا لخوارزمية التجزئة الدقيقة" وتدعم وضعين للتجزئة: تجزئة الكلمات الدقيقة والذكية؛
في بيئة النظام: Core2i73.4G ثنائي النواة، ذاكرة 4G، window764 بت، SunJDK1.6_2964 بت اختبار بيئة الكمبيوتر العادي، يتمتع IK2012 بقدرة معالجة عالية السرعة تبلغ 1.6 مليون كلمة/ثانية (3000 كيلو بايت/ثانية).
يدعم إصدار 2012 من وضع تجزئة الكلمات الذكي معالجة وتوضيح تجزئة الكلمات البسيطة ومخرجات دمج مُحدِّد الكمية.
إنه يعتمد وضع تحليل متعدد المعالجات الفرعية، ويدعم: معالجة تجزئة الكلمات للحروف الإنجليزية والأرقام والمفردات الصينية وما إلى ذلك، وهو متوافق مع تخزين القاموس المحسّن للأحرف الكورية واليابانية، وله مساحة ذاكرة أصغر. يدعم تعريفات قاموس المستخدم الموسعة. على وجه الخصوص، في إصدار 2012، يدعم القاموس الكلمات المختلطة الصينية والإنجليزية والرقمية.