Dieses Repository konzentriert sich auf das Experimentieren mit der LangChain-Bibliothek zum Erstellen leistungsstarker Anwendungen mit großen Sprachmodellen (LLMs). Durch die Nutzung modernster Sprachmodelle wie GPT-3.5 Turbo (und bald GPT-4) von OpenAI zeigt dieses Projekt, wie man aus einem YouTube-Videotranskript eine durchsuchbare Datenbank erstellt, Ähnlichkeitssuchabfragen mithilfe der FAISS-Bibliothek durchführt und Beantworten Sie Benutzerfragen mit relevanten und präzisen Informationen.
LangChain ist ein umfassendes Framework für die Entwicklung von Anwendungen, die auf Sprachmodellen basieren. Es geht über den bloßen Aufruf eines LLM über eine API hinaus, da die fortschrittlichsten und differenziertesten Anwendungen auch datensensitiv und agentenbasiert sind und es Sprachmodellen ermöglichen, sich mit anderen Datenquellen zu verbinden und mit ihrer Umgebung zu interagieren. Das LangChain-Framework wurde speziell entwickelt, um diese Prinzipien zu berücksichtigen.
Der Python-spezifische Teil der LangChain-Dokumentation umfasst mehrere Hauptmodule, die jeweils Beispiele, Anleitungen, Referenzdokumente und konzeptionelle Anleitungen enthalten. Zu diesen Modulen gehören:
Mit LangChain können Entwickler verschiedene Anwendungen erstellen, beispielsweise Chatbots für den Kundensupport, automatisierte Inhaltsgeneratoren, Datenanalysetools und intelligente Suchmaschinen. Diese Anwendungen können Unternehmen dabei helfen, ihre Arbeitsabläufe zu optimieren, manuelle Arbeit zu reduzieren und das Kundenerlebnis zu verbessern.
Durch den Verkauf von LangChain-basierten Anwendungen als Dienstleistung an Unternehmen können Sie maßgeschneiderte Lösungen anbieten, die auf deren spezifische Anforderungen zugeschnitten sind. Unternehmen können beispielsweise von anpassbaren Chatbots profitieren, die Kundenanfragen bearbeiten, personalisierten Content-Erstellungstools für das Marketing oder internen Datenanalysesystemen, die die Leistungsfähigkeit von LLMs nutzen, um wertvolle Erkenntnisse zu gewinnen. Die Möglichkeiten sind enorm und das flexible Framework von LangChain macht es zur idealen Wahl für die Entwicklung und Bereitstellung fortschrittlicher Sprachmodellanwendungen in verschiedenen Branchen.
Die OpenAI-API basiert auf einer Vielzahl von Modellen mit unterschiedlichen Funktionen und Preisen. Sie können auch begrenzte Anpassungen an unseren ursprünglichen Basismodellen für Ihren spezifischen Anwendungsfall mit Feinabstimmung vornehmen.
git clone https://github.com/daveebbelaar/langchain-experiments.git
Python 3.6 oder höher mit venv
oder conda
. Verwendung von venv
:
cd langchain-experiments
python3 -m venv env
source env/bin/activate
conda
verwenden:
cd langchain-experiments
conda create -n langchain-env python=3.8
conda activate langchain-env
pip install -r requirements.txt
Erstellen Sie zunächst eine .env
Datei im Stammverzeichnis des Projekts. Fügen Sie in der Datei Ihren OpenAI-API-Schlüssel hinzu:
OPENAI_API_KEY ="your_api_key_here"
Speichern Sie die Datei und schließen Sie sie. Laden Sie in Ihrem Python-Skript oder Jupyter-Notebook die .env
Datei mit dem folgenden Code:
from dotenv import load_dotenv , find_dotenv
load_dotenv ( find_dotenv ())
Durch die Verwendung der richtigen Namenskonvention für die Umgebungsvariable müssen Sie den Schlüssel nicht manuell in einer separaten Variablen speichern und an die Funktion übergeben. Die Bibliothek oder das Paket, die den API-Schlüssel benötigt, erkennt automatisch die Umgebungsvariable OPENAI_API_KEY
und verwendet ihren Wert.
Bei Bedarf können Sie auf OPENAI_API_KEY
als Umgebungsvariable zugreifen:
import os
api_key = os . environ [ 'OPENAI_API_KEY' ]
Jetzt ist Ihre Python-Umgebung eingerichtet und Sie können mit der Ausführung der Experimente fortfahren.
Dieses Dokument wird Ihnen von Datalumina zur Verfügung gestellt. Wir helfen Datenanalysten, Ingenieuren und Wissenschaftlern bei der Gründung und Skalierung eines erfolgreichen freiberuflichen Unternehmens – über 100.000 USD/Jahr, unterhaltsame Projekte, zufriedene Kunden. Wenn Sie mehr über unsere Arbeit erfahren möchten, können Sie unsere Website besuchen und unseren Newsletter abonnieren. Teilen Sie dieses Dokument gerne mit Ihren Datenfreunden und Kollegen.
Video-Tutorials zur Verwendung der LangChain-Bibliothek und zur Durchführung von Experimenten finden Sie auf dem YouTube-Kanal: youtube.com/@daveebbelaar