Ce projet démontre la puissance et la simplicité de NVIDIA NIM (NVIDIA Inference Model), une suite de microservices cloud natifs optimisés, en configurant et en exécutant un pipeline de génération augmentée de récupération (RAG). NVIDIA NIM est conçu pour rationaliser le déploiement et les délais de commercialisation des modèles d'IA génératifs dans divers environnements, notamment les plateformes cloud, les centres de données et les postes de travail accélérés par GPU. En éliminant les complexités du développement de modèles d'IA et en tirant parti des API conformes aux normes de l'industrie, NIM rend les technologies d'IA avancées accessibles à un plus large éventail de développeurs.
Cloner le référentiel
git clone https://github.com/mickymultani/nvidia-NIM-RAG.git
cd nvidia-NIM-RAG
Mettre en place un environnement virtuel
Créez un environnement virtuel nommé nvidia
:
python -m venv nvidia
Activez l'environnement virtuel :
nvidia S cripts a ctivate
source nvidia/bin/activate
Installer les dépendances
Installez les packages requis à l'aide de pip :
pip install -r requirements.txt
Variables d'environnement
Créez un fichier .env
dans le répertoire racine du projet et ajoutez votre clé API NVIDIA :
NVIDIA_API_KEY=your_nvidia_api_key_here
Remplacez your_nvidia_api_key_here
par votre clé API NVIDIA actuelle.
Pour exécuter le projet, exécutez la commande suivante :
python nim.py
Les contributions à ce projet sont les bienvenues !
Distribué sous licence MIT.