Re-Search는 Google Scholar와 유사한 오픈 소스 데이터 세트 및 학술 연구 논문을 검색하는 데 사용할 수 있는 학술 검색 엔진입니다. 이는 Edinburgh University의 데이터 과학을 위한 텍스트 기술 과정의 일부로 구축되었습니다.
? 이 프로젝트는 또한 동일한 코스에 대해 250명의 학생과 50개 이상의 그룹 중에서 최우수 프로젝트 상을 받았습니다.
Re-Search를 사용하면 TF-IDF, BM25 및 ScaNN의 세 가지 순위 알고리즘을 사용하여 공개적으로 사용 가능한 데이터 세트 및 연구 논문을 검색할 수 있습니다. 또한 기본 검색 유형과 함께 작성자 검색(데이터 포인트가 허용하는 모든 곳), 구문 검색 및 근접 검색을 지원합니다.
Re-Search는 Flask가 지원하는 백엔드와 프론트엔드에 React를 사용하고 MongoDB 데이터베이스에 데이터를 저장합니다. Linux 서버에서만 실행되므로 ScaNN 알고리즘에 대한 별도의 마이크로서비스가 있습니다. 우리는 분산 캐시에 Redis를 사용하지만 분산 캐싱 없이 작동하는 LRU 캐시 구현도 제공합니다. Google Cloud Platform의 App Engine을 통해 로드 밸런싱과 수평 확장성을 제공했습니다.
npm install
및 pip install -r requirements.txt
사용하여 React 및 Python 종속 항목을 설치합니다.npm start
및 flask run
사용하여 실행하세요.sudo service mongod start
사용하여 MongoDB 데이터베이스(repo에 없음)를 실행합니다. prod_*.py
파일을 사용하여 waitress
로 프로덕션에서 백엔드 파일을 실행할 수 있지만 현재 앱은 확장성을 제공하거나 데이터를 안전하게 전송하도록 구성되어 있지 않습니다.
우리는 곧 여름에 SMASH Research Group 서버에 이 프로젝트를 게시할 예정입니다. 그때까지는 Leo/Yuto에 연락하여 데이터베이스 액세스를 요청할 수 있습니다.
Mozilla Public License 2.0 ©️ 재검색 팀