Este repositório contém o código-fonte da técnica Retrieval-augmented Generation (RAG), conforme descrito nos seguintes artigos:
Parte 1: Primeiros passos, Cadeia de Pensamento
Parte 2: Razão-Ação, conversa em várias voltas
Parte 3: ingestão de PDF, pesquisa vetorial
Bônus: RAG com SLM (modelo de linguagem pequena)
Primeiro, você precisa executar o servidor API de llama.cpp com Phi 2:
./server -m /path/to/phi-2.Q4_K_M.gguf
(Para uma resposta mais lenta, mas com maior precisão, considere usar o Mistral 7B OpenOrca).
Para iniciar o Pico Jarvis, você precisa do Node.js v18 ou posterior:
npm install npm start
e abra localhost:5000
.
Faça as seguintes perguntas:
Quem escreveu o Cânone da Medicina?
O ramen é normalmente consumido no Egito?
Quem dirigiu o filme Cavaleiro das Trevas?
Nomeie o destino turístico número 1 da Indonésia!
Qual é a língua nativa do Sr. Spock?
Qual estado dos EUA começa com G?
Qual é o número atômico do magnésio?
Onde encontramos canguru?
Quem é o pai de Luke Skywalker?
Em que país se fala o mandarim?
Qual é o maior rio da América Latina?
Quem foi o autor da teoria da relatividade especial?
Qual metal fictício é infundido no corpo do Wolverine?
Quem navegou na nau capitânia Santa Maria?
Nomeie o grande deserto perto da Mongólia
O que está mais perto de Cingapura: Vietnã ou Austrália?
Quem é o espião fictício 007?
Qual país é conhecido pela IKEA?
Enquanto isso, dúvidas relacionadas ao sistema solar serão respondidas pesquisando o documento PDF:
O que é um planeta anão?
Qual planeta conhecido como o vermelho?
Que materiais compõem os gigantes gasosos?
E os gigantes de gelo?
Explique a heliopausa
Quando a Voyager 2 entrou no espaço interestelar?
E a Voyager 1?
Se você obtiver uma chave de API para OpenWeatherMap e fornecê-la como variável de ambiente OPENWEATHERMAP_API_KEY
, tente perguntar o seguinte:
Como está o clima em Jacarta?
Qual é a temperatura atual em Palo Alto?
No momento está nublado em Seattle?