Indra ist eine effiziente Bibliothek und ein effizienter Dienst zur Bereitstellung von Worteinbettungen und semantischen Zusammenhängen für reale Anwendungen in den Bereichen maschinelles Lernen und Verarbeitung natürlicher Sprache. Es bietet über 60 vorgefertigte Modelle in 15 Sprachen sowie mehrere Modellalgorithmen und Korpora.
Indra wird von Spotify-Annoy unterstützt und bietet eine effiziente Funktion für die Annäherung an die nächsten Nachbarn.
Indra liefert gebrauchsfertige vorgefertigte Modelle mit verschiedenen Algorithmen, Datensatzkorpora und Sprachen. Eine vollständige Liste der vorgefertigten Modelle finden Sie im Wiki.
Zur Installation nutzen Sie bitte das 3-Schritte-Tool IndraComposed.
Dieses Handbuch enthält die grundlegenden Anweisungen für den Einstieg in die Verwendung von Indra. Weitere Details, einschließlich des Antwortformats, zusätzlicher Parameter und der Liste der verfügbaren Modelle und Sprachen, finden Sie im Wiki.
(POST /vectors)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"terms" : [ " love " , " mother " , " santa claus " ]
}
Weitere Einzelheiten finden Sie in der Dokumentation zu Word Embeddings.
(POST /neighbors/vectors)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"topk" : 10 ,
"terms" : [ " love " , " mother " , " santa " ]
}
Weitere Einzelheiten finden Sie in der Dokumentation zu „Nearest Neighbors“.
(POST /neighbors/relatedness)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"topk" : 10 ,
"scoreFunction" : " COSINE " ,
"terms" : [ " love " , " mother " , " santa " ]
}
Weitere Einzelheiten finden Sie in der Dokumentation zu „Nearest Neighbors“.
(POST /relatedness)
{
"corpus" : " wiki-2018 " ,
"model" : " W2V " ,
"language" : " EN " ,
"scoreFunction" : " COSINE " ,
"pairs" : [{
"t2" : " love " ,
"t1" : " mother "
},
{
"t2" : " love " ,
"t1" : " santa claus "
}]
}
Weitere Einzelheiten finden Sie in der Dokumentation zur semantischen Ähnlichkeit.
(POST /relatedness/otm)
{
"corpus" : " wiki-2018 " ,
"model" : " W2V " ,
"language" : " EN " ,
"scoreFunction" : " COSINE " ,
"one" : " love " ,
"many" : [ " mother " , " father " , " child " ]
}
Weitere Einzelheiten finden Sie in der Dokumentation zur semantischen Ähnlichkeit.
Für übersetzte Worteinbettungen und übersetzte semantische Ähnlichkeit hängen Sie einfach „mt“ : true in die JSON-Nutzlast ein.
Wir haben einen öffentlichen Endpunkt nur zu Demonstrationszwecken, daher können Sie es jetzt mit cURL in der Befehlszeile ausprobieren.
curl -X POST -H "Content-Type: application/json" -d '{
"corpus": "wiki-2018",
"model": "W2V",
"language": "EN",
"terms": ["love", "mother", "santa claus"]
}' "http://indra.lambda3.org/vectors"
curl -X POST -H "Content-Type: application/json" -d '{
"corpus": "wiki-2018",
"model": "W2V",
"language": "EN",
"scoreFunction": "COSINE",
"pairs": [{
"t2": "love",
"t1": "mother"
},
{
"t2": "love",
"t1": "santa claus"
}]
}' "http://indra.lambda3.org/relatedness"
Bitte zitieren Sie Indra, wenn Sie es in Ihren Experimenten oder Projekten verwenden.
@InProceedings{indra,
author="Sales, Juliano Efson and Souza, Leonardo and Barzegar, Siamak and Davis, Brian and Freitas, Andr{ ' e} and Handschuh, Siegfried",
title="Indra: A Word Embedding and Semantic Relatedness Server",
booktitle = {Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018)},
month = {May},
year = {2018},
address = {Miyazaki, Japan},
publisher = {European Language Resources Association (ELRA)},
}