arXivRAG é uma ferramenta abrangente projetada para aprimorar a recuperação e geração de conteúdo acadêmico do banco de dados arXiv. Aproveitando técnicas avançadas de geração aumentada de recuperação (RAG), o arXivRAG fornece aos pesquisadores, estudantes e entusiastas a capacidade de descobrir e gerar resumos, insights e análises de artigos arXiv com eficiência.
Geração Aumentada de Recuperação : Combina o poder dos sistemas de recuperação com modelos generativos para aumentar a precisão e a relevância das respostas.
Integração arXiv : consulta diretamente o repositório arXiv para buscar e resumir artigos acadêmicos.
Interface amigável : Fornece uma interface fácil de usar para consulta e obtenção de resumos de artigos científicos.
Customizável : permite que os usuários personalizem os parâmetros de recuperação e geração para atender às suas necessidades específicas.
Pesquisa aprimorada : recursos de pesquisa avançados para encontrar rapidamente artigos relevantes.
Sumarização : Geração automática de resumos concisos para artigos arXiv.
Consultas personalizadas : suporte a consultas personalizadas para recuperar informações específicas de trabalhos acadêmicos.
Acesso em tempo real : integração perfeita com a API arXiv para acesso a dados em tempo real.
Análise de citações e tendências : analise redes de citações, visualize o impacto dos artigos e identifique tendências de pesquisa emergentes com base em publicações recentes e padrões de citações.
Para começar com arXivRAG, siga estas etapas:
Clone o repositório:
git clone https://github.com/phitrann/arXivRAG.git cd arXivRAG
Crie um ambiente virtual (recomendamos usar conda):
conda create -n arxiv-rag python=3.10 conda activate arxiv-rag
Instale as dependências necessárias:
pip install -r requirements.txt
Para usar o arXivRAG, siga estas etapas:
Execute o script principal:
python main.py
Consulte o sistema:
Insira sua consulta relacionada a um artigo científico.
O sistema irá recuperar artigos relevantes do arXiv e gerar um resumo.
Você pode personalizar o comportamento do arXivRAG modificando o arquivo de configuração config.yaml
. Os principais parâmetros incluem:
retrieval_model : O modelo usado para recuperar documentos relevantes.
Generation_model : O modelo usado para gerar resumos.
num_retrievals : o número de artigos a serem recuperados para cada consulta.
max_summary_length : o comprimento máximo do resumo gerado.
Aceitamos contribuições da comunidade! Se você tiver ideias para novos recursos ou melhorias, sinta-se à vontade para abrir um problema ou enviar uma solicitação pull.
Caso você queira enviar uma solicitação pull, siga estas etapas:
Bifurque o repositório.
Crie uma nova ramificação:
git checkout -b feature/your-feature-name
Faça suas alterações e confirme-as:
git commit -m "Add your commit message"
Empurre para o ramo:
git push origin feature/your-feature-name
Crie uma solicitação pull.
Este projeto é lançado sob a licença Apache 2.0. Consulte o arquivo LICENSE para obter detalhes.
Obrigado aos colaboradores do projeto arXivRAG.
Agradecimentos especiais aos desenvolvedores dos modelos de recuperação e geração utilizados neste projeto.