Dieses Repository enthält Code und Ressourcen im Zusammenhang mit Retrieval Augmented Generation (RAG), einer Technik, die das Problem der Datenaktualität in Large Language Models (LLMs) wie Llama-2 lösen soll. LLMs verfügen oft nicht über aktuelle Ereignisse und aktuelle Informationen. RAG integriert externes Wissen aus einer Wissensdatenbank in LLM-Antworten und ermöglicht so genaue und fundierte Antworten.
src
: Enthält den Quellcode für die Implementierung der RAG-Technik und Interaktionen mit der Wissensdatenbank.data
: Speichert Datensätze und relevante Ressourcen für den Aufbau der Wissensdatenbank.db
: Zum Verwalten und Speichern von Token-Einbettungen oder Vektordarstellungen für Wissensdatenbanksuchen.requirements.txt
: Erforderliche Python-Pakete zum Ausführen des Codes in diesem Repository. RAG ist ein neuartiger Ansatz, der die Fähigkeiten von Large Language Models (LLMs) mit externen Wissensdatenbanken kombiniert, um die Qualität und Aktualität der generierten Antworten zu verbessern. Es begegnet der Herausforderung veralteter Informationen, indem es kontextrelevantes Wissen aus externen Quellen abruft und es in LLM-generierte Inhalte integriert.
Gradio ist eine Python-Bibliothek, die Ihnen hilft, schnell Benutzeroberflächen für Ihre Modelle für maschinelles Lernen zu erstellen. Es ermöglicht Ihnen, Modelle schnell bereitzustellen und sie über eine benutzerfreundliche Oberfläche ohne umfangreiche Frontend-Entwicklung zugänglich zu machen.
Eine Gradio-App wird gestartet, wenn der Code gradio_chatbot.py
ausgeführt wird. Es enthält veränderbare Elemente wie das Einbettungsmodell, das Generierungsmodell, eine bearbeitbare Systemeingabeaufforderung und einstellbare Parameter des ausgewählten LLM.
Um den Code in diesem Repository zu verwenden, führen Sie die folgenden Schritte aus:
Klonen Sie das Repository auf Ihren lokalen Computer.
Navigieren Sie über die Befehlszeile zum Repository-Verzeichnis.
Installieren Sie die erforderlichen Pakete mit dem folgenden Befehl:
pip install -r requirements.txt
Führen Sie die Chatbot-Anwendung mit dem folgenden Befehl aus:
python src/gradio_chatbot.py
Sobald die Gradio-App installiert ist, laden Sie ein Dokument (PDF oder CSV) hoch, wählen Sie die Modelle aus (Einbettung und Generierung), passen Sie die einstellbaren Parameter an, fummeln Sie an der Systemeingabeaufforderung herum und stellen Sie alles, was Sie brauchen!