Indra — это эффективная библиотека и сервис для обеспечения встраивания слов и семантической связи с реальными приложениями в области машинного обучения и обработки естественного языка. Он предлагает более 60 готовых моделей на 15 языках, а также несколько алгоритмов моделей и корпусов.
Indra работает на платформе Spotify-Annoy, обеспечивая эффективную функцию приближенного определения ближайших соседей.
Indra предоставляет готовые к использованию предварительно созданные модели с использованием различных алгоритмов, наборов данных и языков. Полный список готовых моделей можно найти в Wiki.
Для установки используйте трехэтапный инструмент IndraCompose.
В этом руководстве представлены основные инструкции, которые помогут вам начать использовать Indra. Более подробную информацию, включая формат ответа, дополнительные параметры, а также список доступных моделей и языков, можно найти в Wiki.
(POST /vectors)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"terms" : [ " love " , " mother " , " santa claus " ]
}
Дополнительные сведения см. в документации Word Embeddings.
(POST /neighbors/vectors)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"topk" : 10 ,
"terms" : [ " love " , " mother " , " santa " ]
}
Для получения более подробной информации ознакомьтесь с документацией по ближайшим соседям.
(POST /neighbors/relatedness)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"topk" : 10 ,
"scoreFunction" : " COSINE " ,
"terms" : [ " love " , " mother " , " santa " ]
}
Для получения более подробной информации ознакомьтесь с документацией по ближайшим соседям.
(POST /relatedness)
{
"corpus" : " wiki-2018 " ,
"model" : " W2V " ,
"language" : " EN " ,
"scoreFunction" : " COSINE " ,
"pairs" : [{
"t2" : " love " ,
"t1" : " mother "
},
{
"t2" : " love " ,
"t1" : " santa claus "
}]
}
Более подробную информацию можно найти в документации по семантическому сходству.
(POST /relatedness/otm)
{
"corpus" : " wiki-2018 " ,
"model" : " W2V " ,
"language" : " EN " ,
"scoreFunction" : " COSINE " ,
"one" : " love " ,
"many" : [ " mother " , " father " , " child " ]
}
Более подробную информацию можно найти в документации по семантическому сходству.
Для встраивания переведенных слов и переведенного семантического сходства просто добавьте «mt» : true в полезные данные JSON.
У нас есть общедоступная конечная точка только для демонстрации, поэтому вы можете попробовать прямо сейчас с помощью cURL в командной строке.
curl -X POST -H "Content-Type: application/json" -d '{
"corpus": "wiki-2018",
"model": "W2V",
"language": "EN",
"terms": ["love", "mother", "santa claus"]
}' "http://indra.lambda3.org/vectors"
curl -X POST -H "Content-Type: application/json" -d '{
"corpus": "wiki-2018",
"model": "W2V",
"language": "EN",
"scoreFunction": "COSINE",
"pairs": [{
"t2": "love",
"t1": "mother"
},
{
"t2": "love",
"t1": "santa claus"
}]
}' "http://indra.lambda3.org/relatedness"
Пожалуйста, цитируйте Индру, если вы используете его в своих экспериментах или проекте.
@InProceedings{indra,
author="Sales, Juliano Efson and Souza, Leonardo and Barzegar, Siamak and Davis, Brian and Freitas, Andr{ ' e} and Handschuh, Siegfried",
title="Indra: A Word Embedding and Semantic Relatedness Server",
booktitle = {Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018)},
month = {May},
year = {2018},
address = {Miyazaki, Japan},
publisher = {European Language Resources Association (ELRA)},
}