ttds cw3 research team
1.0.0
Re-Search是一个学术搜索引擎,可用于搜索开源数据集和学术研究论文,类似于Google Scholar。这是作为爱丁堡大学数据科学文本技术课程的一部分而构建的。
?该项目还从同一课程的 250 名学生/50 多个小组中获得了最佳项目奖。
Re-Search 允许您使用三种不同的排名算法(TF-IDF、BM25 和 ScaNN)搜索公开可用的数据集和研究论文。它还支持作者搜索(只要数据点允许)、短语搜索和邻近搜索及其默认搜索类型。
Re-Search 前端使用 React,后端由 Flask 支持,并将数据存储在 MongoDB 数据库中。它为 ScaNN 算法提供了一个单独的微服务,因为它仅在 Linux 服务器上运行。我们使用 Redis 进行分布式缓存,但我们还提供了无需分布式缓存即可工作的 LRU 缓存实现。我们通过 Google Cloud Platform 的 App Engine 提供负载平衡和水平可扩展性。
npm install
和pip install -r requirements.txt
安装 React 和 Python 依赖项npm start
和flask run
运行它们。sudo service mongod start
运行 MongoDB 数据库(不在存储库中)。您可以使用prod_*.py
文件在生产环境中与waitress
一起运行后端文件,但是,目前该应用程序未配置为提供可扩展性或安全地传输数据。
我们很快就会在夏天在 SMASH Research Group 的服务器上发布这个项目。在此之前,您可以联系 Leo/Yuto 请求访问数据库。
Mozilla 公共许可证 2.0 ©️ 重新搜索团队