El sistema LLAMA_RAG_SYSTEM es un sistema de generación acuático (RAG) sólido diseñado para responder interactivamente a las consultas de los usuarios con respuestas ricas y contextualmente relevantes. Construido utilizando el modelo LLAMA y Ollama , este sistema puede manejar diversas tareas, incluida la respuesta a preguntas generales, resumir contenido y extraer información de los documentos PDF cargados. La arquitectura utiliza ChromAdB para una integración eficiente de documentos y recuperación, al tiempo que incorpora capacidades de raspado web para obtener información actualizada de Internet.
Aquí hay una visión de la interfaz de la aplicación Gradio:
? Tenga en cuenta: este proyecto está actualmente en desarrollo. ¡Sus comentarios y contribuciones son bienvenidos!
Ollama es una excelente opción para ejecutar modelos de aprendizaje automático localmente por varias razones:
El proyecto está organizado de la siguiente manera:
project/
├── core/
│ ├── embedding.py # Embedding-related functionality
│ ├── document_utils.py # Functions to handle document loading and processing
│ ├── query.py # Query document functionality
│ ├── generate.py # Response generation logic
│ ├── web_scrape.py # Web scraping functionality
│
├── scripts/
│ ├── run_flask.py # Script to run Flask API
│ ├── run_gradio.py # Script to run Gradio interface
│
├── chromadb_setup.py # ChromaDB setup and connection
│
├── README.md # Project documentation
Para configurar el LLAMA_RAG_SYSTEM, siga estos pasos:
Clon el repositorio:
git clone https://github.com/NimaVahdat/Llama_RAG_System.git
cd Llama_RAG_System
Asegúrese de que ChromAdB y cualquier otro servicio necesario se ejecuten según sea necesario.
Para iniciar la API de Flask, ejecute el siguiente comando:
python -m scripts.run_flask
Para iniciar la interfaz de Gradio, ejecute:
python -m scripts.run_gradio
Después de ejecutar cualquier script, podrá interactuar con el sistema a través de la interfaz web proporcionada.
¡Las contribuciones son bienvenidas! Si tiene sugerencias para mejoras o características, desembolse el repositorio y envíe una solicitud de extracción.
Este proyecto tiene licencia bajo la licencia MIT; consulte el archivo de licencia para obtener más detalles.
Para cualquier consulta o soporte, contácteme.