Может выполнять сегментацию слов в китайских и английских предложениях со смешанными знаками препинания по всей ширине и половинной ширине. Вы можете выбрать максимальную длину слова фразы, минимальную длину слова предложения со знаками препинания, сохранять ли одно слово в результате сегментации слов, сохранять ли знаки препинания и другие функции. Для получения более подробных инструкций просмотрите файл Readme.txt в загружаемом пакете.
По умолчанию предоставляется файл словаря sqlite. Если ваш виртуальный хост не поддерживает sqlite, вы можете импортировать его в MySQL или создать другие словари самостоятельно.
Из-за моих ограниченных возможностей я не смогу удовлетворить всех с точки зрения эффективности, поэтому, пожалуйста, включите дополнительную информацию.
Монтирование, выгрузка и запрос словаря имеют отдельные функции, поэтому их легко изменить. Базовому алгоритму сегментации слов достаточно, чтобы findinDict возвращал значение true или false, чтобы сообщить мне, есть ли слово в словаре.
Еще следует отметить, что требуется расширение mbstring. Невозможно смешать слова на китайском, английском, полной и половинной ширине. Очень сложно вычислить длину предложения без использования mbstring.
По умолчанию программа предоставляется как расширение ThinkPHP, но вы можете удалить расширение Base и напрямую использовать сегментацию слов. Соглашение об открытом исходном коде Apache2, ТАК, не имеет значения, используется ли оно для коммерческого закрытого исходного кода, если вам не нравится моя программа
Расширять