Эта книга написана в соавторстве с авторами Synonyms.
Ссылка для быстрой покупки книги
«Интеллектуальный ответ на вопросы и глубокое обучение». Эта книга предназначена для студентов и инженеров-программистов, которые готовятся приступить к работе с машинным обучением и обработкой естественного языка. В ней представлены многие теоретические принципы и алгоритмы, а также представлено множество примеров программ для повышения практичности. приведены в библиотеке примеров программного кода. Эти программы в основном предназначены для того, чтобы помочь каждому понять принципы и алгоритмы. Вы можете загрузить и выполнить их. Адрес базы кода:
https://github.com/l11x0m7/book-of-qna-code
Китайские синонимы обработки и понимания естественного языка.
Лучший набор китайских синонимов.
synonyms
можно использовать для многих задач по пониманию естественного языка: выравнивание текста, алгоритмы рекомендаций, расчеты сходства, семантическое смещение, извлечение ключевых слов, извлечение понятий, автоматическое обобщение, поисковые системы и т. д.
npm install node-synonyms
Этот проект представляет собой набор инструментов Synonyms для Node.js. Стабильная версия — v1. Она была протестирована под Mac OSX и Linux . В настоящее время после упаковки размер модуля npm составляет 47 МБ. Это связано с тем, что файл словаря очень большой, поэтому при загрузке нужно набраться терпения.
Поддерживает использование конфигурации переменных среды:
переменные среды | описывать | значение по умолчанию |
---|---|---|
SYN_MODEL_W2V_PATH | Векторный файл Word, полученный после обучения word2vec | node_modules/node-synonyms/data/words.vector |
SYN_WORDSEG_CUSTOM_DICT | Пользовательский словарь сегментации слов | node_modules/node-synonyms/data/tokenizer/user.dict.utf8 |
SYN_WORDSEG_STOPWORD_DICT | словарь стоп-слов сегментации слов | node_modules/node-synonyms/data/tokenizer/stop_words.utf8 |
SYN_WORDSEG_PUNCT_DICT | Словарь пунктуации сегментации слов | node_modules/node-synonyms/data/tokenizer/punctuation.utf8 |
var synonyms = require("node-synonyms") # 使用上述环境变量做定制化
Все возвращаемые значения интерфейса — Promise.
интерфейс сегментации слов
let sen1 = "移动互联网";
synonyms.seg(sen1, true, true)
.then(function(words){
// do your magic
});
стоп-слова (логическое значение), сохранять ли стоп-слова, пункт (логическое значение), сохранять ли знаки препинания.
[Строка], список слов.
["移动","互联网"]
Возвращает вектор слов
synonyms.vector("股市")
.then(function(v){
// do your magic
})
[float]
, вектор 100-мерных значений с плавающей запятой.
Распечатать соседей и релевантность слова
synonyms.display("飞机");
Возвращает соседей слова
synonyms.nearby("股市")
.then(function(results){
// do your magic
});
[[words], [scores]]
содержит два списка, первый — это слово, второй — оценка расстояния соответствующего слова, также в интервале [0 ~ 1], чем ближе к 1, тем больше оно похоже. .
например:
[
["股市","股价","股票市场","股灾","楼市","股票","香港股市","行情","恒指","金融市场"],
[1,0.786284,0.784575,0.751607,0.712255,0.712179,0.710806,0.694434,0.67501,0.666439]
]
Сравните два предложения на предмет сходства.
let sen1 = "移动互联网";
let sen2 = "互联网";
synonyms.compare(sen1, sen2)
.then(function(similarity){
// do your magic
});
Сходство — это плавающее значение в доверительном интервале [0~1]. Чем ближе оно к 1, тем больше оно похоже.
admin/test.sh # 单元测试
Нодеджиеба
Фаст-Левенштейн
вычисление косинусного расстояния
узел-word2vec-читатель
Synonyms публикует сертификат GPL3.0. Данные и процедуры могут использоваться в исследовательских и коммерческих продуктах и должны цитироваться и упоминаться, например, в любых публикуемых средствах массовой информации, журналах или блогах.
@online{Synonyms:hain2017,
author = {Hai Liang Wang, Hu Ying Xi},
title = {中文近义词工具包Synonyms},
year = 2017,
url = {https://github.com/huyingxi/Synonyms},
urldate = {2017-09-27}
}
https://bot.chatopera.com/
Облачный сервис Chatopera — это универсальный облачный сервис для внедрения чат-роботов, оплата за который осуществляется в зависимости от количества вызовов интерфейса. Chatopera Cloud Service — это экземпляр бот-платформы Chatopera, работающий по принципу «программное обеспечение как услуга». Облачный сервис Chatopera, основанный на облачных вычислениях, представляет собой облачный сервис чат-бот как услуга .
Роботизированная платформа Chatopera включает в себя такие компоненты, как база знаний, многораундовый диалог, распознавание намерений и распознавание речи, стандартизированную разработку чат-роботов и поддерживает такие сценарии, как интеллектуальные вопросы и ответы корпоративного OA, интеллектуальные вопросы и ответы для отдела кадров, интеллектуальная служба поддержки клиентов и онлайн-маркетинг. Корпоративные ИТ-отделы и бизнес-отделы используют облачные сервисы Chatopera для быстрого подключения чат-ботов к сети!
Пользовательский словарь
Пользовательские условия
Создать намерение
Добавьте аргументы и слоты
Модель обучения
тестовый разговор
Портрет робота
Системная интеграция
История чата
Используйте сейчас