Este repositorio se centra en experimentar con la biblioteca LangChain para crear aplicaciones potentes con modelos de lenguaje grandes (LLM). Al aprovechar modelos de lenguaje de última generación como GPT-3.5 Turbo de OpenAI (y pronto GPT-4), este proyecto muestra cómo crear una base de datos con capacidad de búsqueda a partir de una transcripción de un video de YouTube, realizar consultas de búsqueda de similitudes utilizando la biblioteca FAISS y responder a las preguntas de los usuarios con información relevante y precisa.
LangChain es un marco integral diseñado para desarrollar aplicaciones basadas en modelos de lenguaje. Va más allá de simplemente llamar a un LLM a través de una API, ya que las aplicaciones más avanzadas y diferenciadas también tienen conocimiento de datos y son agentes, lo que permite que los modelos de lenguaje se conecten con otras fuentes de datos e interactúen con su entorno. El marco LangChain está diseñado específicamente para abordar estos principios.
La parte específica de Python de la documentación de LangChain cubre varios módulos principales, cada uno de los cuales proporciona ejemplos, guías prácticas, documentos de referencia y guías conceptuales. Estos módulos incluyen:
Con LangChain, los desarrolladores pueden crear diversas aplicaciones, como chatbots de atención al cliente, generadores de contenido automatizados, herramientas de análisis de datos y motores de búsqueda inteligentes. Estas aplicaciones pueden ayudar a las empresas a optimizar sus flujos de trabajo, reducir el trabajo manual y mejorar la experiencia de los clientes.
Al vender aplicaciones basadas en LangChain como un servicio a empresas, puede proporcionar soluciones personalizadas para satisfacer sus necesidades específicas. Por ejemplo, las empresas pueden beneficiarse de chatbots personalizables que manejan las consultas de los clientes, herramientas de creación de contenido personalizado para marketing o sistemas de análisis de datos internos que aprovechan el poder de los LLM para extraer información valiosa. Las posibilidades son amplias y el marco flexible de LangChain lo convierte en la opción ideal para desarrollar e implementar aplicaciones de modelos de lenguaje avanzados en diversas industrias.
La API OpenAI funciona con un conjunto diverso de modelos con diferentes capacidades y precios. También puede realizar personalizaciones limitadas a nuestros modelos base originales para su caso de uso específico mediante ajustes.
git clone https://github.com/daveebbelaar/langchain-experiments.git
Python 3.6 o superior usando venv
o conda
. Usando venv
:
cd langchain-experiments
python3 -m venv env
source env/bin/activate
Usando conda
:
cd langchain-experiments
conda create -n langchain-env python=3.8
conda activate langchain-env
pip install -r requirements.txt
Primero, cree un archivo .env
en el directorio raíz del proyecto. Dentro del archivo, agregue su clave API de OpenAI:
OPENAI_API_KEY ="your_api_key_here"
Guarde el archivo y ciérrelo. En su script de Python o cuaderno de Jupyter, cargue el archivo .env
usando el siguiente código:
from dotenv import load_dotenv , find_dotenv
load_dotenv ( find_dotenv ())
Al utilizar la convención de nomenclatura correcta para la variable de entorno, no es necesario almacenar manualmente la clave en una variable separada y pasarla a la función. La biblioteca o paquete que requiere la clave API reconocerá automáticamente la variable de entorno OPENAI_API_KEY
y utilizará su valor.
Cuando sea necesario, puede acceder a OPENAI_API_KEY
como variable de entorno:
import os
api_key = os . environ [ 'OPENAI_API_KEY' ]
Ahora su entorno Python está configurado y puede continuar con la ejecución de los experimentos.
Datalumina le proporciona este documento. Ayudamos a analistas de datos, ingenieros y científicos a lanzar y escalar un negocio independiente exitoso: más de $100 mil al año, proyectos divertidos, clientes satisfechos. Si desea obtener más información sobre lo que hacemos, puede visitar nuestro sitio web y suscribirse a nuestro boletín. No dude en compartir este documento con sus amigos y colegas de datos.
Para ver tutoriales en vídeo sobre cómo utilizar la biblioteca LangChain y realizar experimentos, visite el canal de YouTube: youtube.com/@daveebbelaar