rag with human support Download - rag with human support download do código-fonte

rag with human support

Código-Fonte de IA

1.0.0

Baixar

Aproveitando o usuário para melhorar os agentes em casos de uso RAG

Resumo

Os sistemas RAG tradicionais muitas vezes lutam para fornecer respostas satisfatórias quando os usuários fazem perguntas vagas ou ambíguas sem fornecer contexto suficiente. Isso leva a respostas inúteis como “Não sei” ou respostas incorretas e inventadas fornecidas por um LLM. Este repositório contém código para melhorar os agentes RAG tradicionais.

Apresentamos uma ferramenta LangChain personalizada para um agente RAG, que permite ao agente iniciar um diálogo conversacional com um usuário quando a pergunta inicial não é clara ou muito vaga. Ao fazer perguntas esclarecedoras, solicitar mais detalhes ao usuário e incorporar informações contextuais, o Agente pode reunir o contexto necessário para fornecer uma resposta precisa e útil - mesmo a partir de uma consulta inicial ambígua.

Ilustração

Vamos ilustrar a vantagem usando o seguinte exemplo de pergunta: “Quantas GPUs minha instância EC2 possui?”.

O agente RAG tradicional não sabe qual instância do EC2 o usuário tem em mente. Portanto, fornece uma resposta que não é muito útil:

O Agente RAG aprimorado com a ferramenta `AskHuman`` executa duas etapas adicionais:

1. Perguntar ao usuário em qual instância específica do EC2 ele está interessado.
1. Refinando a consulta de pesquisa para recuperar informações da instância EC2 relevante.

Isso ajuda o agente aprimorado a fornecer uma resposta específica e útil:

Pré-requisitos

Para executar esta demonstração em sua conta AWS, você precisa seguir estas etapas:

Implante um índice Amazon Kendra em sua conta da AWS. Você pode usar o modelo CloudFormation para criar um novo índice Kendra usando a documentação on-line da AWS de Kendra, Lex e SageMaker.
O agente LangChain depende de modelos básicos (FM) disponíveis no Amazon Bedrock, mas podem ser adaptados a qualquer outro LLM compatível com LangChain. Se você não tiver acesso ao Bedrock, substitua llm usado no agente LangChain em demo.py por um LLM compatível com LangChain.
Para experimentar o front-end de amostra, você pode usar o Amazon SageMaker Studio para executar uma implantação local do aplicativo Streamlit.

Implantação

Clone o repositório em seu ambiente (por exemplo, usando o SageMaker Studio).
Abra um novo Terminal e navegue até a pasta do repositório.
Instale dependências executando sh dependencies.sh no Terminal.
Especifique seu respectivo KENDRA_INDEX_ID nos parâmetros do recuperador demo.py .
Inicie o aplicativo Streamlit executando streamlit run demo.py no Terminal.

Limpar

Observe que a implantação de um novo índice Kendra e a execução da demonstração podem adicionar cobranças adicionais à sua conta. Para evitar custos desnecessários, exclua o Amazon Kendra Index se não o usar mais e encerre uma instância do SageMaker Studio se você o usou para executar a demonstração.