ttds cw3 research team
1.0.0
Re-Search是一個學術搜尋引擎,可用於搜尋開源資料集和學術研究論文,類似於Google Scholar。這是作為愛丁堡大學數據科學文本技術課程的一部分而建構的。
?該計畫還從同一課程的 250 名學生/50 多個小組中獲得了最佳計畫獎。
Re-Search 可讓您使用三種不同的排名演算法(TF-IDF、BM25 和 ScaNN)來搜尋公開可用的資料集和研究論文。它還支援作者搜尋(只要數據點允許)、短語搜尋和鄰近搜尋及其預設搜尋類型。
Re-Search 前端使用 React,後端由 Flask 支持,並將資料儲存在 MongoDB 資料庫中。它為 ScaNN 演算法提供了一個單獨的微服務,因為它僅在 Linux 伺服器上運行。我們使用 Redis 進行分散式緩存,但我們還提供了無需分散式快取即可工作的 LRU 快取實作。我們透過 Google Cloud Platform 的 App Engine 提供負載平衡和水平可擴充性。
npm install
和pip install -r requirements.txt
安裝 React 和 Python 依賴項npm start
和flask run
來運行它們。sudo service mongod start
運行 MongoDB 資料庫(不在儲存庫中)。您可以使用prod_*.py
文件在生產環境中與waitress
一起運行後端文件,但是,目前該應用程式未配置為提供可擴展性或安全地傳輸資料。
我們很快就會在夏天在 SMASH Research Group 的伺服器上發布這個專案。在此之前,您可以聯絡 Leo/Yuto 請求存取資料庫。
Mozilla 公共授權 2.0 ©️ 重新搜尋團隊