إندرا هي مكتبة وخدمة فعالة لتقديم تضمينات الكلمات والارتباط الدلالي بتطبيقات العالم الحقيقي في مجالات التعلم الآلي ومعالجة اللغات الطبيعية. وهو يقدم أكثر من 60 نموذجًا تم إنشاؤه مسبقًا بـ 15 لغة والعديد من خوارزميات النماذج والمجموعات.
يتم تشغيل Indra بواسطة Spotify-Annoy مما يوفر وظيفة تقريبية فعالة لأقرب الجيران.
تقدم Indra نماذج جاهزة للاستخدام مسبقة الإنشاء باستخدام خوارزميات مختلفة ومجموعة بيانات ولغات. للحصول على قائمة كاملة بنماذج ما قبل البناء، يرجى مراجعة Wiki.
للتثبيت، يرجى استخدام أداة IndraCompose المكونة من 3 خطوات.
يوفر هذا الدليل الإرشادات الأساسية للبدء في استخدام Indra. لمزيد من التفاصيل، بما في ذلك تنسيق الاستجابة والمعلمات الإضافية وقائمة النماذج واللغة المتاحة، يرجى مراجعة Wiki.
(POST /vectors)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"terms" : [ " love " , " mother " , " santa claus " ]
}
لمزيد من التفاصيل، راجع وثائق Word Embeddings.
(POST /neighbors/vectors)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"topk" : 10 ,
"terms" : [ " love " , " mother " , " santa " ]
}
لمزيد من التفاصيل، راجع وثائق أقرب الجيران.
(POST /neighbors/relatedness)
{
"corpus" : " googlenews " ,
"model" : " W2V " ,
"language" : " EN " ,
"topk" : 10 ,
"scoreFunction" : " COSINE " ,
"terms" : [ " love " , " mother " , " santa " ]
}
لمزيد من التفاصيل، راجع وثائق أقرب الجيران.
(POST /relatedness)
{
"corpus" : " wiki-2018 " ,
"model" : " W2V " ,
"language" : " EN " ,
"scoreFunction" : " COSINE " ,
"pairs" : [{
"t2" : " love " ,
"t1" : " mother "
},
{
"t2" : " love " ,
"t1" : " santa claus "
}]
}
لمزيد من التفاصيل، راجع وثائق التشابه الدلالي.
(POST /relatedness/otm)
{
"corpus" : " wiki-2018 " ,
"model" : " W2V " ,
"language" : " EN " ,
"scoreFunction" : " COSINE " ,
"one" : " love " ,
"many" : [ " mother " , " father " , " child " ]
}
لمزيد من التفاصيل، راجع وثائق التشابه الدلالي.
بالنسبة لتضمينات الكلمات المترجمة والتشابه الدلالي المترجم، ما عليك سوى إلحاق "mt" : true في حمولة JSON.
لدينا نقطة نهاية عامة للتوضيح فقط، ومن ثم يمكنك تجربتها الآن باستخدام cURL في سطر الأوامر.
curl -X POST -H "Content-Type: application/json" -d '{
"corpus": "wiki-2018",
"model": "W2V",
"language": "EN",
"terms": ["love", "mother", "santa claus"]
}' "http://indra.lambda3.org/vectors"
curl -X POST -H "Content-Type: application/json" -d '{
"corpus": "wiki-2018",
"model": "W2V",
"language": "EN",
"scoreFunction": "COSINE",
"pairs": [{
"t2": "love",
"t1": "mother"
},
{
"t2": "love",
"t1": "santa claus"
}]
}' "http://indra.lambda3.org/relatedness"
يرجى ذكر إندرا، إذا كنت تستخدمه في تجاربك أو مشروعك.
@InProceedings{indra,
author="Sales, Juliano Efson and Souza, Leonardo and Barzegar, Siamak and Davis, Brian and Freitas, Andr{ ' e} and Handschuh, Siegfried",
title="Indra: A Word Embedding and Semantic Relatedness Server",
booktitle = {Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018)},
month = {May},
year = {2018},
address = {Miyazaki, Japan},
publisher = {European Language Resources Association (ELRA)},
}