تنزيل ansj_seg - تنزيل كود المصدر ansj

ansj_seg

جافا كود المصدر

ansj_seg

تنزيل

Ansj تجزئة الكلمة الصينية

يساعد

وثائق التطوير: الإصدار 3.x وما قبله، الإصدار 5.x وما بعده

ملخص

هذا تطبيق جافا لتجزئة الكلمات الصينية استنادًا إلى n-Gram+CRF+HMM.

تصل سرعة تجزئة الكلمات إلى حوالي 2 مليون كلمة في الثانية (تم اختبارها على نظام mac air)، ويمكن أن تصل الدقة إلى أكثر من 96%.

حاليًا، تم تنفيذ وظائف مثل تجزئة الكلمات الصينية، والتعرف على الأسماء الصينية، والقواميس المعرفة من قبل المستخدم، واستخراج الكلمات الرئيسية، والتلخيص التلقائي، ووضع علامات على الكلمات الرئيسية.

يمكن تطبيقه على معالجة اللغة الطبيعية وجوانب أخرى، وهو مناسب لمختلف المشاريع التي تتطلب تأثيرات عالية لتجزئة الكلمات.

مخضرم

        
        <dependency>
            <groupId>org.ansj</groupId>
            <artifactId>ansj_seg</artifactId>
            <version>5.1.1</version>
        </dependency>

اتصل بالعرض التوضيحي

إذا قمت بالتنزيل لأول مرة وتريد فقط اختبار تأثير الاختبار، فيمكنك استدعاء هذه الواجهة البسيطة


 String str = "欢迎使用ansj_seg,(ansj中文分词)在这里如果你遇到什么问题都可以联系我.我一定尽我所能.帮助大家.ansj_seg更快,更准,更自由!" ;
 System.out.println(ToAnalysis.parse(str));
 
 欢迎/v,使用/v,ansj/en,_,seg/en,,,(,ansj/en,中文/nz,分词/n,),在/p,这里/r,如果/c,你/r,遇到/v,什么/r,问题/n,都/d,可以/v,联系/v,我/r,./m,我/r,一定/d,尽我所能/l,./m,帮助/v,大家/r,./m,ansj/en,_,seg/en,更快/d,,,更/d,准/a,,,更/d,自由/a,!

انضم إلينا

لقد كنت أفكر في ذلك لفترة طويلة، بغض النظر عما إذا كان أي شخص يمكن أن يساعدني. سأكتبها إذا كنت مهتمًا أو متحمسًا، يمكنك الاتصال بي.

وثائق تكميلية، إضافة أمثلة وتعليمات الاتصال
أضف بعض عمليات التعرف العادية، على سبيل المثال، التعرف على رقم بطاقة الهوية، غير المكتمل حاليًا، بما في ذلك时间识别، IP地址识别،邮箱识别،网址识别،词性识别، وما إلى ذلك...
توفير نموذج CRF أكثر تحسينًا. استبدل نموذج ansj الافتراضي.
حالات الاختبار التكميلي، واختبار غير مكتمل في العديد من الأماكن. إذا كنت مهتما يمكنك المساعدة!
إعادة بناء نموذج التعرف على الاسم. أضف نماذج مثل التعرف على اسم المؤسسة.
إضافة تحليل بناء الجملة والنحوي
تنفيذ طريقة تجزئة الكلمات في lstm
إملأ الفراغات...

يوسع

معلومات إضافية

الإصدار ansj_seg
النوع جافا كود المصدر
وقت التحديث 2024-12-21
الحجم 24.14MB
من Github

تطبيقات ذات صلة

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Dog_Fox_Bunny

2022-08-01
محرك تحليل البيانات Lihua الإصدار المجاني 3.0_search_navigation_collection_public Oplic_ranking_api

2022-06-28

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
redisson

جافا كود المصدر

redisson-3.40.1
opentelemetry java instrumentation

جافا كود المصدر

Version 2.10.0
PrettyZoo

جافا كود المصدر

v2.1.1
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
wp functions

فئات أخرى

1.0.0
termwind

فئات أخرى

v2.3.0

أخبار ذات صلة الكل