Загрузка ansj_seg - Загрузка исходного кода ansj

ansj_seg

Исходный код JAVA

ansj_seg

Скачать

Сегментация китайских слов Ansj

Помощь

Документы разработки: версия 3.x и ранее, версия 5.x и позже.

краткое содержание

Это Java-реализация сегментации китайских слов на основе n-Gram+CRF+HMM.

Скорость сегментации слов достигает около 2 миллионов слов в секунду (проверено на Mac Air), а точность может достигать более 96%.

В настоящее время реализованы такие функции, как сегментация китайских слов, распознавание китайских имен, определяемые пользователем словари, извлечение ключевых слов, автоматическое суммирование и маркировка ключевых слов.

Его можно применять для обработки естественного языка и других аспектов, а также подходит для различных проектов, требующих высоких эффектов сегментации слов.

знаток

        
        <dependency>
            <groupId>org.ansj</groupId>
            <artifactId>ansj_seg</artifactId>
            <version>5.1.1</version>
        </dependency>

Вызов демо

Если вы загружаете впервые и просто хотите протестировать тестовый эффект, вы можете вызвать этот простой интерфейс


 String str = "欢迎使用ansj_seg,(ansj中文分词)在这里如果你遇到什么问题都可以联系我.我一定尽我所能.帮助大家.ansj_seg更快,更准,更自由!" ;
 System.out.println(ToAnalysis.parse(str));
 
 欢迎/v,使用/v,ansj/en,_,seg/en,,,(,ansj/en,中文/nz,分词/n,),在/p,这里/r,如果/c,你/r,遇到/v,什么/r,问题/n,都/d,可以/v,联系/v,我/r,./m,我/r,一定/d,尽我所能/l,./m,帮助/v,大家/r,./m,ansj/en,_,seg/en,更快/d,,,更/d,准/a,,,更/d,自由/a,!

Присоединяйтесь к нам

Я долго об этом думал, неважно, сможет ли кто-нибудь мне помочь. Я запишу, если вам интересно или у вас есть энтузиазм, вы можете связаться со мной.

Дополнительная документация, добавление примеров вызовов и инструкций.
Добавьте некоторые обычные функции распознавания, например, распознавание номера удостоверения личности, которое в настоящее время не завершено, включая时间识别, IP地址识别,邮箱识别,网址识别,词性识别и т. д.
Предоставьте более оптимизированную модель CRF. Замените модель ansj по умолчанию.
Дополнительные тест-кейсы, во многих местах неполное тестирование. Если вам интересно, вы можете помочь!
Восстановите модель распознавания имени. Добавьте такие модели, как распознавание названия организации.
Добавьте синтаксический и грамматический анализ
Реализовать метод сегментации слов lstm
Заполните пробелы...

Расширять

Дополнительная информация