rag with human support Download - rag with human support Quellcode herunterladen

rag with human support

AI-Quellcode

1.0.0

Herunterladen

Nutzung des Benutzers zur Verbesserung von Agenten in RAG-Anwendungsfällen

Zusammenfassung

Herkömmliche RAG-Systeme haben oft Schwierigkeiten, zufriedenstellende Antworten zu liefern, wenn Benutzer vage oder mehrdeutige Fragen stellen, ohne ausreichenden Kontext bereitzustellen. Dies führt zu wenig hilfreichen Antworten wie „Ich weiß nicht“ oder falschen, erfundenen Antworten eines LLM. Dieses Repo enthält Code zur Verbesserung herkömmlicher RAG-Agenten.

Wir stellen ein benutzerdefiniertes LangChain-Tool für einen RAG-Agenten vor, das es dem Agenten ermöglicht, einen Dialog mit einem Benutzer zu führen, wenn die anfängliche Frage unklar oder zu vage ist. Indem er klärende Fragen stellt, den Benutzer zu weiteren Details auffordert und kontextbezogene Informationen einbezieht, kann der Agent den notwendigen Kontext sammeln, um eine genaue, hilfreiche Antwort zu geben – selbst bei einer mehrdeutigen anfänglichen Anfrage.

Illustration

Lassen Sie uns den Vorteil anhand des folgenden Fragebeispiels verdeutlichen: „Wie viele GPUs hat meine EC2-Instanz?“

Der herkömmliche RAG-Agent weiß nicht, welche EC2-Instanz der Benutzer im Sinn hat. Daher gibt es eine Antwort, die nicht sehr hilfreich ist:

Der verbesserte RAG-Agent mit dem Tool „AskHuman“ führt zwei zusätzliche Schritte aus:

1. Fragen Sie den Benutzer, an welcher konkreten EC2-Instanz er interessiert ist.
1. Verfeinern der Suchabfrage, um Informationen für die relevante EC2-Instanz abzurufen.

Dies hilft dem verbesserten Agenten, eine spezifische und hilfreiche Antwort zu geben:

Voraussetzungen

Um diese Demo in Ihrem AWS-Konto auszuführen, müssen Sie die folgenden Schritte ausführen:

Stellen Sie einen Amazon Kendra-Index in Ihrem AWS-Konto bereit. Sie können die CloudFormation-Vorlage verwenden, um mithilfe der AWS-Onlinedokumentation von Kendra, Lex und SageMaker einen neuen Kendra-Index zu erstellen.
Der LangChain-Agent basiert auf Foundation Models (FM), die in Amazon Bedrock verfügbar sind, kann jedoch an jedes andere LLM angepasst werden, das LangChain unterstützt. Wenn Sie keinen Zugriff auf Bedrock haben, ersetzen Sie llm das im LangChain-Agenten in demo.py verwendet wird, durch ein unterstütztes LLM von LangChain.
Um mit dem Beispiel-Frontend zu experimentieren, können Sie Amazon SageMaker Studio verwenden, um eine lokale Bereitstellung der Streamlit-App auszuführen.

Einsatz

Klonen Sie das Repository in Ihre Umgebung (z. B. mit SageMaker Studio).
Öffnen Sie ein neues Terminal und navigieren Sie zum Repository-Ordner.
Installieren Sie Abhängigkeiten, indem Sie sh dependencies.sh im Terminal ausführen.
Geben Sie Ihre entsprechende KENDRA_INDEX_ID in den Retriever-Parametern demo.py an.
Starten Sie die Streamlit-App, indem Sie streamlit run demo.py im Terminal ausführen.

Aufräumen

Beachten Sie, dass durch die Bereitstellung eines neuen Kendra-Index und die Ausführung der Demo möglicherweise zusätzliche Kosten auf Ihrer Rechnung anfallen. Um unnötige Kosten zu vermeiden, löschen Sie bitte den Amazon Kendra Index, wenn Sie ihn nicht mehr verwenden, und fahren Sie eine SageMaker Studio-Instanz herunter, wenn Sie ihn zum Ausführen der Demo verwendet haben.

Autoren

Antonia Wiebeler, Datenwissenschaftlerin, AWS Generative AI Innovation Center
Nikita Kozodoi, angewandte Wissenschaftlerin, AWS Generative AI Innovation Center

Expandieren

Zusätzliche Informationen