arXivRAG es una herramienta integral diseñada para mejorar la recuperación y generación de contenido académico de la base de datos arXiv. Aprovechando las técnicas avanzadas de recuperación-generación aumentada (RAG), arXivRAG proporciona a investigadores, estudiantes y entusiastas la capacidad de descubrir y generar resúmenes, conocimientos y análisis de artículos arXiv de manera eficiente.
Generación aumentada de recuperación : combina el poder de los sistemas de recuperación con modelos generativos para mejorar la precisión y relevancia de las respuestas.
Integración arXiv : consulta directamente el repositorio arXiv para buscar y resumir artículos académicos.
Interfaz fácil de usar : proporciona una interfaz fácil de usar para consultar y obtener resúmenes de artículos científicos.
Personalizable : permite a los usuarios personalizar los parámetros de recuperación y generación para satisfacer sus necesidades específicas.
Búsqueda mejorada : capacidades de búsqueda avanzada para encontrar rápidamente artículos relevantes.
Resumen : generación automática de resúmenes concisos para artículos arXiv.
Consultas personalizadas : soporte de consultas personalizadas para recuperar información específica de trabajos académicos.
Acceso en tiempo real : integración perfecta con la API arXiv para acceso a datos en tiempo real.
Análisis de tendencias y citas : analice redes de citas, visualice el impacto de los artículos e identifique tendencias de investigación emergentes basadas en publicaciones recientes y patrones de citas.
Para comenzar con arXivRAG, siga estos pasos:
Clonar el repositorio:
git clone https://github.com/phitrann/arXivRAG.git cd arXivRAG
Cree un entorno virtual (recomendamos usar conda):
conda create -n arxiv-rag python=3.10 conda activate arxiv-rag
Instale las dependencias requeridas:
pip install -r requirements.txt
Para utilizar arXivRAG, siga estos pasos:
Ejecute el script principal:
python main.py
Consultar el sistema:
Ingrese su consulta relacionada con un artículo científico.
El sistema recuperará los artículos relevantes de arXiv y generará un resumen.
Puede personalizar el comportamiento de arXivRAG modificando el archivo de configuración config.yaml
. Los parámetros clave incluyen:
retrieval_model : el modelo utilizado para recuperar artículos relevantes.
Generation_model : el modelo utilizado para generar resúmenes.
num_retrievals : el número de artículos que se recuperarán para cada consulta.
max_summary_length : la longitud máxima del resumen generado.
¡Agradecemos las contribuciones de la comunidad! Si tiene ideas para nuevas funciones o mejoras, no dude en abrir un problema o enviar una solicitud de extracción.
En caso de que desee enviar una solicitud de extracción, siga estos pasos:
Bifurca el repositorio.
Crea una nueva rama:
git checkout -b feature/your-feature-name
Realice sus cambios y confírmelos:
git commit -m "Add your commit message"
Empujar a la sucursal:
git push origin feature/your-feature-name
Crea una solicitud de extracción.
Este proyecto se publica bajo la licencia Apache 2.0. Consulte el archivo de LICENCIA para obtener más detalles.
Gracias a los contribuyentes del proyecto arXivRAG.
Un agradecimiento especial a los desarrolladores de los modelos de recuperación y generación utilizados en este proyecto.