Este projeto demonstra o poder e a simplicidade do NVIDIA NIM (NVIDIA Inference Model), um conjunto de microsserviços otimizados nativos da nuvem, configurando e executando um pipeline de geração aumentada de recuperação (RAG). O NVIDIA NIM foi projetado para agilizar a implantação e o tempo de lançamento no mercado de modelos generativos de IA em vários ambientes, incluindo plataformas de nuvem, data centers e estações de trabalho aceleradas por GPU. Ao abstrair as complexidades do desenvolvimento de modelos de IA e aproveitar APIs padrão do setor, o NIM torna as tecnologias avançadas de IA acessíveis a uma gama mais ampla de desenvolvedores.
Clonar o repositório
git clone https://github.com/mickymultani/nvidia-NIM-RAG.git
cd nvidia-NIM-RAG
Configure um ambiente virtual
Crie um ambiente virtual chamado nvidia
:
python -m venv nvidia
Ative o ambiente virtual:
nvidia S cripts a ctivate
source nvidia/bin/activate
Instalar dependências
Instale os pacotes necessários usando pip:
pip install -r requirements.txt
Variáveis de ambiente
Crie um arquivo .env
no diretório raiz do projeto e adicione sua chave de API NVIDIA:
NVIDIA_API_KEY=your_nvidia_api_key_here
Substitua your_nvidia_api_key_here
pela sua chave de API NVIDIA real.
Para executar o projeto, execute o seguinte comando:
python nim.py
Contribuições para este projeto são bem-vindas!
Distribuído sob a licença MIT.