Le LLAMA_RAG_SYSTH est un système de génération (RAG) robuste de récupération (RAG) conçu pour répondre de manière interactive aux requêtes utilisateur avec des réponses riches et contextuellement pertinentes. Construit à l'aide du modèle LLAMA et Olllama , ce système peut gérer diverses tâches, notamment en répondant aux questions générales, en résumant le contenu et en extraction des informations à partir de documents PDF téléchargés. L'architecture utilise ChromAdB pour une intégration et une récupération de documents efficaces, tout en incorporant également les capacités de grattement Web pour récupérer des informations à jour sur Internet.
Voici un aperçu de l'interface de l'application Gradio:
? Veuillez noter: ce projet est actuellement en développement. Vos commentaires et contributions sont les bienvenus!
Olllama est une excellente option pour exécuter des modèles d'apprentissage automatique localement pour plusieurs raisons:
Le projet est organisé comme suit:
project/
├── core/
│ ├── embedding.py # Embedding-related functionality
│ ├── document_utils.py # Functions to handle document loading and processing
│ ├── query.py # Query document functionality
│ ├── generate.py # Response generation logic
│ ├── web_scrape.py # Web scraping functionality
│
├── scripts/
│ ├── run_flask.py # Script to run Flask API
│ ├── run_gradio.py # Script to run Gradio interface
│
├── chromadb_setup.py # ChromaDB setup and connection
│
├── README.md # Project documentation
Pour configurer le LLAMA_RAG_SYSTH, suivez ces étapes:
Clone le référentiel:
git clone https://github.com/NimaVahdat/Llama_RAG_System.git
cd Llama_RAG_System
Assurez-vous que ChromAdB et tout autre service nécessaire fonctionnent au besoin.
Pour démarrer l'API FLASK, exécutez la commande suivante:
python -m scripts.run_flask
Pour lancer l'interface Gradio, exécutez:
python -m scripts.run_gradio
Après avoir exécuté l'un ou l'autre script, vous pourrez interagir avec le système via l'interface Web fournie.
Les contributions sont les bienvenues! Si vous avez des suggestions d'améliorations ou de fonctionnalités, veuillez débarquer le référentiel et soumettre une demande de traction.
Ce projet est autorisé en vertu de la licence MIT - voir le fichier de licence pour plus de détails.
Pour toute demande ou soutien, veuillez me contacter.