rag with human support Descargar - rag with human support Descarga del código fuente

rag with human support

Código Fuente de IA

1.0.0

Descargar

Aprovechar al usuario para mejorar los agentes en casos de uso de RAG

Resumen

Los sistemas RAG tradicionales a menudo tienen dificultades para proporcionar respuestas satisfactorias cuando los usuarios hacen preguntas vagas o ambiguas sin proporcionar suficiente contexto. Esto lleva a respuestas inútiles como "No sé" o respuestas incorrectas e inventadas proporcionadas por un LLM. Este repositorio contiene código para mejorar los agentes RAG tradicionales.

Presentamos una herramienta LangChain personalizada para un agente de RAG, que permite al agente entablar un diálogo conversacional con un usuario cuando la pregunta inicial no está clara o es demasiado vaga. Al hacer preguntas aclaratorias, solicitar al usuario más detalles e incorporar información contextual, el Agente puede recopilar el contexto necesario para brindar una respuesta precisa y útil, incluso a partir de una consulta inicial ambigua.

Ilustración

Ilustremos la ventaja usando el siguiente ejemplo de pregunta: "¿Cuántas GPU tiene mi instancia EC2?".

El agente RAG tradicional no sabe qué instancia EC2 tiene en mente el usuario. Por tanto, proporciona una respuesta que no es de mucha ayuda:

El Agente RAG mejorado con la herramienta `AskHuman`` realiza dos pasos adicionales:

1. Preguntar al usuario qué instancia EC2 específica le interesa.
1. Refinar la consulta de búsqueda para recuperar información para la instancia EC2 relevante.

Esto ayuda al agente mejorado a proporcionar una respuesta específica y útil:

Requisitos previos

Para ejecutar esta demostración en su cuenta de AWS, debe seguir estos pasos:

Implemente un índice Amazon Kendra en su cuenta de AWS. Puede utilizar la plantilla de CloudFormation para crear un nuevo índice de Kendra utilizando la documentación en línea de AWS de Kendra, Lex y SageMaker.
LangChain Agent se basa en Foundation Models (FM) disponible en Amazon Bedrock, pero se puede adaptar a cualquier otro LLM que admita LangChain. Si no tiene acceso a Bedrock, reemplace llm utilizado en LangChain Agent en demo.py con un LLM compatible con LangChain.
Para experimentar con la interfaz de muestra, puede utilizar Amazon SageMaker Studio para ejecutar una implementación local de la aplicación Streamlit.

Despliegue

Clone el repositorio en su entorno (por ejemplo, utilizando SageMaker Studio).
Abra una nueva Terminal y navegue hasta la carpeta del repositorio.
Instale dependencias ejecutando sh dependencies.sh en la Terminal.
Especifique su KENDRA_INDEX_ID respectivo en los parámetros del recuperador demo.py
Inicie la aplicación Streamlit ejecutando streamlit run demo.py en la Terminal.

Limpiar

Tenga en cuenta que implementar un nuevo índice Kendra y ejecutar la demostración podría agregar cargos adicionales a su factura. Para evitar incurrir en costos innecesarios, elimine el índice Amazon Kendra si ya no lo usa y cierre una instancia de SageMaker Studio si la usó para ejecutar la demostración.

Autores

Antonia Wiebeler, científica de datos, Centro de innovación de IA generativa de AWS
Nikita Kozodoi, científica aplicada, Centro de innovación de IA generativa de AWS

Expandir

Información adicional