arXivRAG — это комплексный инструмент, предназначенный для улучшения поиска и создания академического контента из базы данных arXiv. Используя передовые методы поиска и дополненной генерации (RAG), arXivRAG предоставляет исследователям, студентам и энтузиастам возможность эффективно обнаруживать и генерировать резюме, идеи и анализ статей arXiv.
Генерация с расширенным поиском : сочетает в себе возможности поисковых систем с генеративными моделями для повышения точности и актуальности ответов.
Интеграция arXiv : напрямую запрашивает репозиторий arXiv для получения и обобщения научных статей.
Удобный интерфейс : Обеспечивает простой в использовании интерфейс для запроса и получения резюме научных работ.
Настраиваемый : позволяет пользователям настраивать параметры поиска и генерации в соответствии со своими конкретными потребностями.
Расширенный поиск : возможности расширенного поиска для быстрого поиска соответствующих статей.
Резюмирование : автоматическое создание кратких аннотаций для статей arXiv.
Пользовательские запросы : поддержка индивидуальных запросов для получения конкретной информации из научных статей.
Доступ в реальном времени : бесшовная интеграция с API arXiv для доступа к данным в реальном времени.
Анализ цитирования и тенденций : анализируйте сети цитирования, визуализируйте влияние статей и выявляйте новые исследовательские тенденции на основе недавних публикаций и моделей цитирования.
Чтобы начать работу с arXivRAG, выполните следующие действия:
Клонируем репозиторий:
git clone https://github.com/phitrann/arXivRAG.git cd arXivRAG
Создайте виртуальную среду (рекомендуем использовать conda):
conda create -n arxiv-rag python=3.10 conda activate arxiv-rag
Установите необходимые зависимости:
pip install -r requirements.txt
Чтобы использовать arXivRAG, выполните следующие действия:
Запустите основной скрипт:
python main.py
Запросить систему:
Введите запрос, связанный с научной статьей.
Система получит соответствующие документы из arXiv и сформирует резюме.
Вы можете настроить поведение arXivRAG, изменив файл конфигурации config.yaml
. Ключевые параметры включают в себя:
retrival_model : модель, используемая для поиска соответствующих документов.
Generation_model : модель, используемая для создания сводок.
num_retrivals : количество документов, которые нужно получить по каждому запросу.
max_summary_length : максимальная длина сгенерированной сводки.
Мы приветствуем вклад сообщества! Если у вас есть идеи относительно новых функций или улучшений, смело открывайте проблему или отправляйте запрос на включение.
Если вы хотите отправить запрос на включение, выполните следующие действия:
Форкните репозиторий.
Создайте новую ветку:
git checkout -b feature/your-feature-name
Внесите изменения и зафиксируйте их:
git commit -m "Add your commit message"
Нажмите на ветку:
git push origin feature/your-feature-name
Создайте запрос на включение.
Этот проект выпущен под лицензией Apache 2.0. Подробности смотрите в файле ЛИЦЕНЗИИ.
Спасибо участникам проекта arXivRAG.
Особая благодарность разработчикам моделей поиска и генерации, использованных в этом проекте.