Descarga hands on llms - Descarga de código fuente hands on llms

hands on llms

Otro código fuente

1.0.0

Descargar

Curso práctico de LLM

Aprenda a capacitar e implementar un asesor financiero en tiempo real

por Paul Iusztin, Pau Labarta Bajo y Alexandru Razvant

Tabla de contenido

1. Bloques de construcción
- 1.1. Canal de capacitación
- 1.2. Tubería de transmisión en tiempo real
- 1.3. Canalización de inferencia
- 1.4. Conjunto de datos de preguntas y respuestas financieras
2. Configurar servicios externos
- 2.1. Alpaca
- 2.2. Qdrant
- 2.3. Cometa ML
- 2.4. Haz
- 2.5. AWS
3. Instalación y uso
4. Conferencias
- 4.1. Costos
- 4.2. Hacer las cuestiones
- 4.3. Videoconferencias
- 4.4. Artículos
5. Licencia
6. Colaboradores y profesores

1. Bloques de construcción

Usando el diseño de 3 tuberías, esto es lo que aprenderá a construir en este curso ↓

1.1. Canal de capacitación

Canal de capacitación que:

carga un conjunto de datos propietario de preguntas y respuestas
afina un LLM de código abierto usando QLoRA
registra los experimentos de entrenamiento en el rastreador de experimentos de Comet ML y los resultados de inferencia en el panel LLMOps de Comet ML
almacena el mejor modelo en el registro de modelos de Comet ML

El proceso de capacitación se implementa utilizando Beam como infraestructura de GPU sin servidor.

-> Se encuentra en el directorio modules/training_pipeline .

Requisitos mínimos de hardware

CPU: 4 núcleos
RAM: 14 GB
VRAM: 10 GiB (GPU Nvidia habilitada para CUDA obligatoria)

Nota: No te preocupes si no tienes los requisitos mínimos de hardware. Le mostraremos cómo implementar el proceso de capacitación en la infraestructura sin servidor de Beam y capacitar al LLM allí.

1.2. Tubería de transmisión en tiempo real

Canalización de funciones en tiempo real que:

ingiere noticias financieras de Alpaca
limpia y transforma los documentos de noticias en incrustaciones en tiempo real usando Bytewax
almacena las incrustaciones en Qdrant Vector DB

La canalización de streaming se implementa automáticamente en una máquina AWS EC2 mediante una canalización de CI/CD integrada en acciones de GitHub.

-> Se encuentra en el directorio modules/streaming_pipeline .

Requisitos mínimos de hardware

CPU: 1 núcleo
RAM: 2 GiB
VRAM: -

1.3. Canalización de inferencia

Canal de inferencia que utiliza LangChain para crear una cadena que:

descarga el modelo ajustado del registro de modelos de Comet
toma las preguntas de los usuarios como entrada
consulta Qdrant Vector DB y mejora el mensaje con noticias financieras relacionadas
llama al LLM optimizado para obtener asesoramiento financiero utilizando la consulta inicial, el contexto de la base de datos vectorial y el historial de chat
persiste el historial de chat en la memoria
registra el mensaje y la respuesta en la función de monitoreo LLMOps de Comet ML

El canal de inferencia se implementa utilizando Beam como infraestructura de GPU sin servidor, como API RESTful. Además, está incluido en una interfaz de usuario con fines de demostración, implementada en Gradio.

-> Se encuentra en el directorio modules/financial_bot .

Requisitos mínimos de hardware

CPU: 4 núcleos
RAM: 14 GB
VRAM: 8 GiB (GPU Nvidia habilitada para CUDA obligatoria)

Nota: No te preocupes si no tienes los requisitos mínimos de hardware. Le mostraremos cómo implementar el canal de inferencia en la infraestructura sin servidor de Beam y llamar al LLM desde allí.

arquitectura

1.4. Conjunto de datos de preguntas y respuestas financieras

Usamos GPT3.5 para generar un conjunto de datos de preguntas y respuestas financieras para ajustar nuestro LLM de código abierto para especializarnos en el uso de términos financieros y responder preguntas financieras. El uso de un LLM grande, como GPT3.5 para generar un conjunto de datos que entrene un LLM más pequeño (por ejemplo, Falcon 7B) se conoce como ajuste fino con destilación .

→ Para comprender cómo generamos el conjunto de datos de preguntas y respuestas financieras, consulte este artículo escrito por Pau Labarta.

→ Para ver un análisis completo del conjunto de datos de preguntas y respuestas financieras, consulte la subsección dataset_analysis del curso escrito por Alexandru Razvant.

EDA

2. Configurar servicios externos

Antes de sumergirse en los módulos, debe configurar un par de herramientas externas adicionales para el curso.

NOTA: Puede configurarlos sobre la marcha para cada módulo, ya que le indicaremos en cada módulo lo que necesita.

2.1. Alpaca

financial news data source

Siga este documento para mostrarle cómo crear una cuenta GRATUITA y generar las claves API que necesitará en este curso.

Nota: 1x conexión de datos de Alpaca es GRATIS.

2.2. Qdrant

serverless vector DB

Vaya a Qdrant y cree una cuenta GRATIS.

Luego, siga este documento sobre cómo generar las claves API que necesitará en este curso.

Nota: Utilizaremos únicamente el plan freemium de Qdrant.

2.3. Cometa ML

serverless ML platform

Vaya a Comet ML y cree una cuenta GRATIS.

Luego, sigue esta guía para generar una CLAVE API y un nuevo proyecto, que necesitarás dentro del curso.

Nota: Utilizaremos únicamente el plan freemium de Comet ML.

2.4. Haz

serverless GPU compute | training & inference pipelines

Vaya a Beam y cree una cuenta GRATIS.

Luego, debe seguir su guía de instalación para instalar su CLI y configurarla con sus credenciales de Beam.

Para leer más sobre Beam, aquí hay una guía de introducción.

Nota: Tienes aproximadamente 10 horas de computación gratuitas. Después, pagas sólo por lo que usas. Si tiene una GPU Nvidia >8 GB de VRAM y no desea implementar los canales de entrenamiento e inferencia, usar Beam es opcional.

Solución de problemas

Al usar Poetry, tuvimos problemas para ubicar la CLI de Beam dentro de un entorno virtual de Poetry. Para solucionar este problema, después de instalar Beam, creamos un enlace simbólico que apunta a los archivos binarios de Poetry, de la siguiente manera:

 export COURSE_MODULE_PATH= < your-course-module-path > # e.g., modules/training_pipeline
 cd $COURSE_MODULE_PATH
 export POETRY_ENV_PATH= $( dirname $( dirname $( poetry run which python ) ) )

 ln -s /usr/local/bin/beam ${POETRY_ENV_PATH} /bin/beam

2.5. AWS

cloud compute | feature pipeline

Vaya a AWS, cree una cuenta y genere un par de credenciales.

Luego, descargue e instale su AWS CLI v2.11.22 y configúrelo con sus credenciales.

Nota: Pagarás sólo por lo que uses. Implementará solo una máquina virtual EC2 t2.small , que cuesta solo ~$0.023 por hora. Si no desea implementar la canalización de funciones, utilizar AWS es opcional.

3. Instalación y uso

Cada módulo tiene sus dependencias y scripts. En una configuración de producción, cada módulo tendría su repositorio, pero en este caso de uso, con fines de aprendizaje, ponemos todo en un solo lugar:

Por lo tanto, consulte el archivo README de cada módulo individualmente para ver cómo instalarlo y usarlo:

q_and_a_dataset_generator
canal_entrenamiento
tubería_transmisión
tubería_inferencia

4. Conferencias

Le recomendamos encarecidamente que clone este repositorio y replique todo lo que hemos hecho para aprovechar al máximo este curso.

En las videoconferencias, artículos y documentación README de cada módulo, encontrará instrucciones paso a paso.

¡Feliz aprendizaje!

4.1. Costos

El código GitHub (publicado bajo la licencia MIT) y las videoconferencias (publicadas en YouTube) son totalmente gratuitos. Siempre lo será.

Las lecciones de Medium se publican en el muro pago de Medium. Si ya lo tienes, entonces son gratis. De lo contrario, deberá pagar una tarifa mensual de $5 para leer los artículos.

4.2. Hacer las cuestiones

Si tienes alguna duda o problema durante el curso, te animamos a crear un número en este repositorio donde puedas explicar todo lo que necesitas en profundidad.

De lo contrario, también puedes contactar con los profesores en LinkedIn:

Pablo Iusztin
Pau Labarta