Indra é uma biblioteca e serviço eficiente para fornecer incorporação de palavras e relacionamento semântico para aplicações do mundo real nos domínios de aprendizado de máquina e processamento de linguagem natural. Oferece mais de 60 modelos pré-construídos em 15 idiomas e vários algoritmos de modelo e corpora.
Indra é alimentado por spotify-annoy, oferecendo uma função eficiente de vizinhos mais próximos aproximados.
A Indra oferece modelos pré-construídos prontos para uso usando diferentes algoritmos, corpora de conjuntos de dados e linguagens. Para obter uma lista completa de modelos pré-construídos, verifique o Wiki.
Para instalar, use a ferramenta de 3 etapas IndraComposed.
Este guia fornece as instruções básicas para você começar a usar o Indra. Para mais detalhes, incluindo o formato da resposta, parâmetros adicionais e a lista de modelos e idiomas disponíveis, consulte o Wiki.
(POST /vectors)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"terms" : [ " love " , " mother " , " santa claus " ]
}
Para mais detalhes, verifique a documentação do Word Embeddings.
(POST /neighbors/vectors)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"topk" : 10 ,
"terms" : [ " love " , " mother " , " santa " ]
}
Para mais detalhes, verifique a documentação dos Vizinhos Mais Próximos.
(POST /neighbors/relatedness)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"topk" : 10 ,
"scoreFunction" : " COSINE " ,
"terms" : [ " love " , " mother " , " santa " ]
}
Para mais detalhes, verifique a documentação dos Vizinhos Mais Próximos.
(POST /relatedness)
{
"corpus" : " wiki-2018 " ,
"model" : " W2V " ,
"language" : " EN " ,
"scoreFunction" : " COSINE " ,
"pairs" : [{
"t2" : " love " ,
"t1" : " mother "
},
{
"t2" : " love " ,
"t1" : " santa claus "
}]
}
Para mais detalhes, consulte a documentação de Similaridade Semântica.
(POST /relatedness/otm)
{
"corpus" : " wiki-2018 " ,
"model" : " W2V " ,
"language" : " EN " ,
"scoreFunction" : " COSINE " ,
"one" : " love " ,
"many" : [ " mother " , " father " , " child " ]
}
Para mais detalhes, consulte a documentação de Similaridade Semântica.
Para incorporações de palavras traduzidas e similaridade semântica traduzida, basta acrescentar "mt" : true na carga JSON.
Temos um endpoint público apenas para demonstração, portanto você pode tentar agora mesmo com cURL na linha de comando.
curl -X POST -H "Content-Type: application/json" -d '{
"corpus": "wiki-2018",
"model": "W2V",
"language": "EN",
"terms": ["love", "mother", "santa claus"]
}' "http://indra.lambda3.org/vectors"
curl -X POST -H "Content-Type: application/json" -d '{
"corpus": "wiki-2018",
"model": "W2V",
"language": "EN",
"scoreFunction": "COSINE",
"pairs": [{
"t2": "love",
"t1": "mother"
},
{
"t2": "love",
"t1": "santa claus"
}]
}' "http://indra.lambda3.org/relatedness"
Por favor, cite Indra, se você usá-lo em seus experimentos ou projetos.
@InProceedings{indra,
author="Sales, Juliano Efson and Souza, Leonardo and Barzegar, Siamak and Davis, Brian and Freitas, Andr{ ' e} and Handschuh, Siegfried",
title="Indra: A Word Embedding and Semantic Relatedness Server",
booktitle = {Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018)},
month = {May},
year = {2018},
address = {Miyazaki, Japan},
publisher = {European Language Resources Association (ELRA)},
}