Re-Search هو محرك بحث أكاديمي يمكن استخدامه للبحث في مجموعات البيانات مفتوحة المصدر وأوراق البحث الأكاديمية المشابهة لـ Google Scholar. تم إنشاء هذا كجزء من الدورات الدراسية لدورة تقنيات النصوص لعلوم البيانات بجامعة إدنبرة.
؟ حصل هذا المشروع أيضًا على جائزة أفضل مشروع من بين 250 طالبًا / أكثر من 50 مجموعة لنفس الدورة.
يتيح لك Re-Search البحث عن مجموعات البيانات والأوراق البحثية المتاحة للعامة باستخدام ثلاث خوارزميات تصنيف مختلفة - TF-IDF، وBM25، وScaNN. كما أنه يدعم البحث عن المؤلف (حيثما تسمح نقطة البيانات بذلك)، والبحث عن العبارات، والبحث التقريبي بالإضافة إلى نوع البحث الافتراضي الخاص به.
يستخدم Re-Search React للواجهة الأمامية مع دعم الواجهة الخلفية بواسطة Flask ويقوم بتخزين البيانات في قاعدة بيانات MongoDB. يحتوي على خدمة صغيرة منفصلة لخوارزمية ScaNN لأنه يعمل فقط على خوادم Linux. نحن نستخدم Redis لذاكرة التخزين المؤقت الموزعة ولكننا نوفر أيضًا تطبيق LRU Cache الذي يعمل بدون التخزين المؤقت الموزع. لقد قدمنا موازنة التحميل وقابلية التوسع الأفقي باستخدام محرك التطبيقات الخاص بـ Google Cloud Platform.
npm install
و pip install -r requirements.txt
npm start
وتشغيل flask run
على التوالي.sudo service mongod start
. يمكنك تشغيل ملفات الواجهة الخلفية في الإنتاج مع waitress
باستخدام ملفات prod_*.py
، ومع ذلك، في الوقت الحالي، لم يتم تكوين التطبيق لتوفير قابلية التوسع أو نقل البيانات بشكل آمن.
سنقوم قريبًا بنشر هذا المشروع على خوادم SMASH Research Group في الصيف. وحتى ذلك الحين، يمكنك طلب الوصول إلى قاعدة البيانات عن طريق الاتصال بـ Leo/Yuto.
رخصة موزيلا العامة 2.0 ©️ فريق إعادة البحث