Indra es una biblioteca y un servicio eficiente para ofrecer incrustaciones de palabras y relaciones semánticas con aplicaciones del mundo real en los dominios del aprendizaje automático y el procesamiento del lenguaje natural. Ofrece más de 60 modelos prediseñados en 15 idiomas y varios algoritmos y corpus de modelos.
Indra funciona con Spotify-Annoy y ofrece una función eficiente de aproximación de vecinos más cercanos.
Indra ofrece modelos preconstruidos listos para usar utilizando diferentes algoritmos, corpus de conjuntos de datos y lenguajes. Para obtener una lista completa de modelos prediseñados, consulte la Wiki.
Para instalar, utilice la herramienta de 3 pasos IndraComposed.
Esta guía proporciona las instrucciones básicas para empezar a utilizar Indra. Para obtener más detalles, incluido el formato de respuesta, parámetros adicionales y la lista de modelos e idiomas disponibles, consulte la Wiki.
(POST /vectors)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"terms" : [ " love " , " mother " , " santa claus " ]
}
Para obtener más detalles, consulte la documentación de incrustaciones de Word.
(POST /neighbors/vectors)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"topk" : 10 ,
"terms" : [ " love " , " mother " , " santa " ]
}
Para obtener más detalles, consulte la documentación de Vecinos más cercanos.
(POST /neighbors/relatedness)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"topk" : 10 ,
"scoreFunction" : " COSINE " ,
"terms" : [ " love " , " mother " , " santa " ]
}
Para obtener más detalles, consulte la documentación de Vecinos más cercanos.
(POST /relatedness)
{
"corpus" : " wiki-2018 " ,
"model" : " W2V " ,
"language" : " EN " ,
"scoreFunction" : " COSINE " ,
"pairs" : [{
"t2" : " love " ,
"t1" : " mother "
},
{
"t2" : " love " ,
"t1" : " santa claus "
}]
}
Para obtener más detalles, consulte la documentación de Similitud semántica.
(POST /relatedness/otm)
{
"corpus" : " wiki-2018 " ,
"model" : " W2V " ,
"language" : " EN " ,
"scoreFunction" : " COSINE " ,
"one" : " love " ,
"many" : [ " mother " , " father " , " child " ]
}
Para obtener más detalles, consulte la documentación de Similitud semántica.
Para incrustaciones de palabras traducidas y similitudes semánticas traducidas, simplemente agregue "mt" : true en la carga útil JSON.
Tenemos un punto final público solo para demostración, por lo que puede intentarlo ahora mismo con cURL en la línea de comando.
curl -X POST -H "Content-Type: application/json" -d '{
"corpus": "wiki-2018",
"model": "W2V",
"language": "EN",
"terms": ["love", "mother", "santa claus"]
}' "http://indra.lambda3.org/vectors"
curl -X POST -H "Content-Type: application/json" -d '{
"corpus": "wiki-2018",
"model": "W2V",
"language": "EN",
"scoreFunction": "COSINE",
"pairs": [{
"t2": "love",
"t1": "mother"
},
{
"t2": "love",
"t1": "santa claus"
}]
}' "http://indra.lambda3.org/relatedness"
Por favor cita a Indra, si la utilizas en tus experimentos o proyectos.
@InProceedings{indra,
author="Sales, Juliano Efson and Souza, Leonardo and Barzegar, Siamak and Davis, Brian and Freitas, Andr{ ' e} and Handschuh, Siegfried",
title="Indra: A Word Embedding and Semantic Relatedness Server",
booktitle = {Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018)},
month = {May},
year = {2018},
address = {Miyazaki, Japan},
publisher = {European Language Resources Association (ELRA)},
}