Indra
2.2.0-rc8
Indra は、機械学習と自然言語処理の分野で現実世界のアプリケーションに単語の埋め込みと意味的な関連性を提供する効率的なライブラリとサービスです。 15 の言語で 60 以上のビルド済みモデルと、いくつかのモデル アルゴリズムとコーパスが提供されます。
Indra は、効率的な近似最近傍関数を提供する Spotify-annoy を利用しています。
Indra は、さまざまなアルゴリズム、データセットコーパス、および言語を使用して、すぐに使用できる事前構築モデルを提供します。事前構築モデルの完全なリストについては、Wiki を確認してください。
インストールするには、3 ステップのツール IndraComped を使用してください。
このガイドでは、Indra の使用を開始するための基本的な手順を説明します。応答形式、追加パラメータ、利用可能なモデルと言語のリストなどの詳細については、Wiki を確認してください。
(POST /vectors)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"terms" : [ " love " , " mother " , " santa claus " ]
}
詳細については、Word 埋め込みのドキュメントを確認してください。
(POST /neighbors/vectors)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"topk" : 10 ,
"terms" : [ " love " , " mother " , " santa " ]
}
詳細については、最近傍のドキュメントを確認してください。
(POST /neighbors/relatedness)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"topk" : 10 ,
"scoreFunction" : " COSINE " ,
"terms" : [ " love " , " mother " , " santa " ]
}
詳細については、最近傍のドキュメントを確認してください。
(POST /relatedness)
{
"corpus" : " wiki-2018 " ,
"model" : " W2V " ,
"language" : " EN " ,
"scoreFunction" : " COSINE " ,
"pairs" : [{
"t2" : " love " ,
"t1" : " mother "
},
{
"t2" : " love " ,
"t1" : " santa claus "
}]
}
詳細については、セマンティック類似性のドキュメントを確認してください。
(POST /relatedness/otm)
{
"corpus" : " wiki-2018 " ,
"model" : " W2V " ,
"language" : " EN " ,
"scoreFunction" : " COSINE " ,
"one" : " love " ,
"many" : [ " mother " , " father " , " child " ]
}
詳細については、セマンティック類似性のドキュメントを確認してください。
翻訳された単語の埋め込みと翻訳された意味の類似性については、JSON ペイロードに"mt" : trueを追加するだけです。
デモンストレーション専用のパブリック エンドポイントがあるため、コマンド ラインでcURL を使用して今すぐ試すことができます。
curl -X POST -H "Content-Type: application/json" -d '{
"corpus": "wiki-2018",
"model": "W2V",
"language": "EN",
"terms": ["love", "mother", "santa claus"]
}' "http://indra.lambda3.org/vectors"
curl -X POST -H "Content-Type: application/json" -d '{
"corpus": "wiki-2018",
"model": "W2V",
"language": "EN",
"scoreFunction": "COSINE",
"pairs": [{
"t2": "love",
"t1": "mother"
},
{
"t2": "love",
"t1": "santa claus"
}]
}' "http://indra.lambda3.org/relatedness"
実験やプロジェクトで Indra を使用する場合は、Indra を引用してください。
@InProceedings{indra,
author="Sales, Juliano Efson and Souza, Leonardo and Barzegar, Siamak and Davis, Brian and Freitas, Andr{ ' e} and Handschuh, Siegfried",
title="Indra: A Word Embedding and Semantic Relatedness Server",
booktitle = {Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018)},
month = {May},
year = {2018},
address = {Miyazaki, Japan},
publisher = {European Language Resources Association (ELRA)},
}