Re-Search adalah mesin pencari akademis yang dapat digunakan untuk mencari kumpulan data sumber terbuka dan makalah penelitian akademis yang mirip dengan Google Cendekia. Ini dibuat sebagai bagian dari kursus Teknologi Teks untuk Ilmu Data di Universitas Edinburgh.
? Proyek ini juga menerima Penghargaan Proyek Terbaik di antara 250 siswa / 50+ grup untuk kursus yang sama.
Pencarian Ulang memungkinkan Anda mencari kumpulan data dan makalah penelitian yang tersedia untuk umum menggunakan tiga algoritma pemeringkatan yang berbeda - TF-IDF, BM25, dan ScanNN. Ini juga mendukung Pencarian Penulis (di mana pun titik data mengizinkannya), Pencarian Frasa, dan Pencarian Kedekatan bersama dengan jenis pencarian defaultnya.
Pencarian Ulang menggunakan React untuk frontend dengan backend didukung oleh Flask dan menyimpan data dalam database MongoDB. Ini memiliki layanan mikro terpisah untuk algoritma ScaNN karena hanya berjalan di server Linux. Kami menggunakan Redis untuk cache terdistribusi tetapi kami juga menyediakan implementasi LRU Cache yang berfungsi tanpa cache terdistribusi. Kami menyediakan penyeimbangan beban dan skalabilitas horizontal dengan App Engine Google Cloud Platform.
npm install
dan pip install -r requirements.txt
npm start
dan flask run
.sudo service mongod start
. Anda dapat menjalankan file backend dalam produksi dengan waitress
menggunakan file prod_*.py
, namun saat ini, aplikasi tidak dikonfigurasi untuk memberikan skalabilitas atau mentransfer data dengan aman.
Kami akan segera mempublikasikan proyek ini di server SMASH Research Group pada musim panas. Sampai saat itu Anda dapat meminta akses database dengan menghubungi Leo/Yuto.
Lisensi Publik Mozilla 2.0 ©️ Tim Pencarian Ulang