Indra
2.2.0-rc8
Indra 是一個高效的函式庫和服務,可為機器學習和自然語言處理領域的實際應用程式提供詞嵌入和語義相關性。它提供 15 種語言的 60 多個預建模型以及多種模型演算法和語料庫。
Indra 由 Spotify-annoy 提供支持,提供高效的近似最近鄰函數。
Indra 使用不同的演算法、資料集語料庫和語言提供即用型預先建構模型。有關預構建模型的完整列表,請查看 Wiki。
若要安裝,請使用 3 步驟工具 IndraCompished。
本指南提供了開始使用 Indra 的基本說明。有關更多詳細信息,包括響應格式、附加參數以及可用模型和語言的列表,請查看 Wiki。
(POST /vectors)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"terms" : [ " love " , " mother " , " santa claus " ]
}
有關更多詳細信息,請查看詞嵌入文件。
(POST /neighbors/vectors)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"topk" : 10 ,
"terms" : [ " love " , " mother " , " santa " ]
}
有關更多詳細信息,請查看最近鄰居文檔。
(POST /neighbors/relatedness)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"topk" : 10 ,
"scoreFunction" : " COSINE " ,
"terms" : [ " love " , " mother " , " santa " ]
}
有關更多詳細信息,請查看最近鄰居文檔。
(POST /relatedness)
{
"corpus" : " wiki-2018 " ,
"model" : " W2V " ,
"language" : " EN " ,
"scoreFunction" : " COSINE " ,
"pairs" : [{
"t2" : " love " ,
"t1" : " mother "
},
{
"t2" : " love " ,
"t1" : " santa claus "
}]
}
有關更多詳細信息,請查看語義相似性文件。
(POST /relatedness/otm)
{
"corpus" : " wiki-2018 " ,
"model" : " W2V " ,
"language" : " EN " ,
"scoreFunction" : " COSINE " ,
"one" : " love " ,
"many" : [ " mother " , " father " , " child " ]
}
有關更多詳細信息,請查看語義相似性文件。
對於翻譯後的字詞嵌入和翻譯後的語意相似度,只需在 JSON 負載中附加"mt" : true即可。
我們有一個僅用於演示的公共端點,因此您現在可以在命令列上使用cURL進行嘗試。
curl -X POST -H "Content-Type: application/json" -d '{
"corpus": "wiki-2018",
"model": "W2V",
"language": "EN",
"terms": ["love", "mother", "santa claus"]
}' "http://indra.lambda3.org/vectors"
curl -X POST -H "Content-Type: application/json" -d '{
"corpus": "wiki-2018",
"model": "W2V",
"language": "EN",
"scoreFunction": "COSINE",
"pairs": [{
"t2": "love",
"t1": "mother"
},
{
"t2": "love",
"t1": "santa claus"
}]
}' "http://indra.lambda3.org/relatedness"
如果您在實驗或專案中使用 Indra,請引用它。
@InProceedings{indra,
author="Sales, Juliano Efson and Souza, Leonardo and Barzegar, Siamak and Davis, Brian and Freitas, Andr{ ' e} and Handschuh, Siegfried",
title="Indra: A Word Embedding and Semantic Relatedness Server",
booktitle = {Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018)},
month = {May},
year = {2018},
address = {Miyazaki, Japan},
publisher = {European Language Resources Association (ELRA)},
}