Скачать hands on llms - hands on llms Скачать исходный код

hands on llms

Другой исходный код

1.0.0

Скачать

Практический курс LLM

Научитесь обучать и использовать финансового консультанта, работающего в режиме реального времени

Пол Юстин, Пау Лабарта Баджо и Александру Развант

1. Строительные блоки
- 1.1. Обучение
- 1.2. Потоковая передача в реальном времени
- 1.3. Конвейер вывода
- 1.4. Набор данных финансовых вопросов и ответов
2. Настройка внешних служб
- 2.1. Альпака
- 2.2. Кдрант
- 2.3. Комета МЛ
- 2.4. Луч
- 2.5. АВС
3. Установка и использование
4. Лекции
- 4.1. Затраты
- 4.2. Задавайте вопросы
- 4.3. Видеолекции
- 4.4. Статьи
5. Лицензия
6. Участники и преподаватели

1. Строительные блоки

Используя трехконвейерную конструкцию, это то, что вы научитесь строить в этом курсе ↓

1.1. Обучение

Тренинговый конвейер, который:

загружает собственный набор данных вопросов и ответов
оптимизирует LLM с открытым исходным кодом с помощью QLoRA
регистрирует обучающие эксперименты в трекере экспериментов Comet ML и результаты выводов на информационной панели LLMOps Comet ML.
сохраняет лучшую модель в реестре моделей Comet ML.

Конвейер обучения развертывается с использованием Beam в качестве бессерверной инфраструктуры графического процессора.

-> Находится в каталоге modules/training_pipeline .

Минимальные требования к оборудованию

Процессор: 4 ядра
ОЗУ: 14 ГиБ
Видеопамять: 10 ГиБ (обязательный графический процессор Nvidia с поддержкой CUDA)

Примечание. Не волнуйтесь, если у вас нет минимальных требований к оборудованию. Мы покажем вам, как развернуть конвейер обучения в бессерверной инфраструктуре Beam и обучать LLM там.

1.2. Потоковая передача в реальном времени

Конвейер функций в реальном времени, который:

принимает финансовые новости от Альпаки
очищает и преобразует новостные документы во встраивания в режиме реального времени с помощью Bytewax
сохраняет вложения в базу данных Qdrant Vector DB.

Конвейер потоковой передачи автоматически развертывается на компьютере AWS EC2 с помощью конвейера CI/CD, встроенного в действия GitHub.

-> Находится в каталоге modules/streaming_pipeline .

Минимальные требования к оборудованию

Процессор: 1 ядро
ОЗУ: 2 ГиБ
Видеопамять: -

1.3. Конвейер вывода

Конвейер вывода, использующий LangChain для создания цепочки, которая:

загружает точно настроенную модель из реестра моделей Comet.
принимает вопросы пользователей в качестве входных данных
запрашивает базу данных Qdrant Vector и дополняет подсказку соответствующими финансовыми новостями.
вызывает настроенную LLM для получения финансовой консультации, используя первоначальный запрос, контекст из векторной базы данных и историю чата
сохраняет историю чата в памяти
регистрирует подсказку и ответ в функции мониторинга LLMOps Comet ML

Конвейер вывода развертывается с использованием Beam в качестве бессерверной инфраструктуры графического процессора и RESTful API. Кроме того, для демонстрационных целей он заключен в пользовательский интерфейс, реализованный в Gradio.

-> Находится в каталоге modules/financial_bot .

Минимальные требования к оборудованию

Процессор: 4 ядра
ОЗУ: 14 ГиБ
Видеопамять: 8 ГБ (обязательный графический процессор Nvidia с поддержкой CUDA)

Примечание. Не волнуйтесь, если у вас нет минимальных требований к оборудованию. Мы покажем вам, как развернуть конвейер вывода в бессерверной инфраструктуре Beam и вызвать LLM оттуда.

архитектура

1.4. Набор данных финансовых вопросов и ответов

Мы использовали GPT3.5 для создания набора финансовых данных вопросов и ответов, чтобы настроить нашу LLM с открытым исходным кодом, чтобы она специализировалась на использовании финансовых терминов и ответах на финансовые вопросы. Использование большого LLM, такого как GPT3.5 для создания набора данных, который обучает меньший LLM (например, Falcon 7B), называется точной настройкой с помощью дистилляции .

→ Чтобы понять, как мы создали набор финансовых данных вопросов и ответов, прочтите эту статью, написанную Пау Лабартой.

→ Чтобы увидеть полный анализ набора финансовых данных вопросов и ответов, ознакомьтесь с подразделом dataset_anaанализ курса, написанного Александру Развантом.

ЭДА

2. Настройка внешних служб

Прежде чем погрузиться в модули, вам необходимо настроить для курса пару дополнительных внешних инструментов.

ПРИМЕЧАНИЕ. Вы можете настроить их по ходу работы для каждого модуля, поскольку в каждом модуле мы укажем вам то, что вам нужно.

2.1. Альпака

financial news data source

Следуйте этому документу, чтобы показать вам, как создать БЕСПЛАТНУЮ учетную запись и сгенерировать ключи API, которые вам понадобятся в рамках этого курса.

Примечание. 1 подключение для передачи данных Alpaca БЕСПЛАТНО.

2.2. Кдрант

serverless vector DB

Перейдите в Qdrant и создайте БЕСПЛАТНУЮ учетную запись.

После этого следуйте этому документу о том, как сгенерировать ключи API, которые вам понадобятся в рамках этого курса.

Примечание. Мы будем использовать только бесплатный план Qdrant.

2.3. Комета МЛ

serverless ML platform

Перейдите на Comet ML и создайте БЕСПЛАТНУЮ учетную запись.

После этого следуйте этому руководству, чтобы создать КЛЮЧ API и новый проект, который вам понадобится в рамках курса.

Примечание. Мы будем использовать только бесплатный план Comet ML.

2.4. Луч

serverless GPU compute | training & inference pipelines

Перейдите в Beam и создайте БЕСПЛАТНУЮ учетную запись.

После этого вы должны следовать их руководству по установке, чтобы установить интерфейс командной строки и настроить его с использованием своих учетных данных Beam.

Чтобы узнать больше о Beam, ознакомьтесь с вводным руководством.

Примечание. У вас есть около 10 бесплатных вычислительных часов. После этого вы платите только за то, чем пользуетесь. Если у вас графический процессор Nvidia >8 ГБ видеопамяти и вы не хотите развертывать конвейеры обучения и вывода, использование Beam не является обязательным.

Поиск неисправностей

При использовании Poetry у нас возникли проблемы с поиском интерфейса командной строки Beam внутри виртуальной среды Poetry. Чтобы исправить это, после установки Beam мы создаем символическую ссылку, указывающую на двоичные файлы Poetry, следующим образом:

 export COURSE_MODULE_PATH= < your-course-module-path > # e.g., modules/training_pipeline
 cd $COURSE_MODULE_PATH
 export POETRY_ENV_PATH= $( dirname $( dirname $( poetry run which python ) ) )

 ln -s /usr/local/bin/beam ${POETRY_ENV_PATH} /bin/beam

2.5. АВС

cloud compute | feature pipeline

Перейдите в AWS, создайте учетную запись и создайте пару учетных данных.

После этого загрузите и установите AWS CLI v2.11.22 и настройте его, используя свои учетные данные.

Примечание. Вы платите только за то, чем пользуетесь. Вы развернете только виртуальную машину EC2 t2.small , стоимость которой составляет всего ~$0.023 в час. Если вы не хотите развертывать конвейер функций, использование AWS не является обязательным.

3. Установка и использование

Каждый модуль имеет свои зависимости и скрипты. В производственной установке у каждого модуля будет свой репозиторий, но в данном случае в целях обучения мы поместили все в одно место:

Таким образом, проверьте README для каждого модуля отдельно, чтобы узнать, как его установить и использовать:

q_and_a_dataset_generator
Training_pipeline
потоковый_конвейер
вывод_конвейер

4. Лекции

Мы настоятельно рекомендуем вам клонировать этот репозиторий и повторить все, что мы сделали, чтобы получить максимальную отдачу от этого курса.

В видеолекциях, статьях и документации README каждого модуля вы найдете пошаговые инструкции.

Приятного обучения!

4.1. Затраты

Код GitHub (выпущенный по лицензии MIT) и видеолекции (выпущенные на YouTube) совершенно бесплатны. Всегда будет.

Уроки Medium публикуются на платной стене Medium. Если они у вас уже есть, то они бесплатны. В противном случае вам придется платить ежемесячную плату в размере 5 долларов за чтение статей.

4.2. Задавайте вопросы

Если во время курса у вас возникнут какие-либо вопросы или проблемы, мы рекомендуем вам создать задачу в этом репозитории, где вы сможете подробно объяснить все, что вам нужно.

В противном случае вы также можете связаться с преподавателями в LinkedIn:

Пол Юстин
Пау Лабарта