Re-Search — это академическая поисковая система, которую можно использовать для поиска в наборах данных с открытым исходным кодом и научных исследовательских работах, аналогичных Google Scholar. Он был создан в рамках курсовой работы по курсу «Текстовые технологии для науки о данных» Эдинбургского университета.
? Этот проект также получил награду за лучший проект среди 250 студентов / более 50 групп одного курса.
Re-Search позволяет вам искать общедоступные наборы данных и исследовательские работы, используя три различных алгоритма ранжирования — TF-IDF, BM25 и ScaNN. Он также поддерживает поиск по автору (если это позволяет точка данных), поиск по фразе и поиск по близости, а также тип поиска по умолчанию.
Re-Search использует React для внешнего интерфейса, а серверная часть поддерживается Flask, и сохраняет данные в базе данных MongoDB. У него есть отдельный микросервис для алгоритма ScanN, поскольку он работает только на серверах Linux. Мы используем Redis для распределенного кэша, но мы также предоставляем реализацию LRU Cache, которая работает без распределенного кэширования. Мы обеспечили балансировку нагрузки и горизонтальную масштабируемость с помощью App Engine Google Cloud Platform.
npm install
и pip install -r requirements.txt
npm start
и flask run
соответственно.sudo service mongod start
. Вы можете запустить серверные файлы в рабочей среде с помощью waitress
используя файлы prod_*.py
, однако в настоящее время приложение не настроено для обеспечения масштабируемости или безопасной передачи данных.
Летом мы скоро опубликуем этот проект на серверах SMASH Research Group. До тех пор вы можете запросить доступ к базе данных, связавшись с Лео/Юто.
Общественная лицензия Mozilla 2.0 ©️ The Re-Search Team