Получите свою копию сегодня и, пожалуйста, оставьте оценку/отзыв, чтобы высказать мне свое мнение!
Добро пожаловать в репозиторий GitHub, где находится «Краткое руководство по большим языковым моделям — второе издание» . Этот репозиторий содержит фрагменты кода и блокноты, использованные в книге, демонстрирующие различные приложения и передовые методы работы с моделями Transformer и большими языковыми моделями (LLM). Посмотреть код для первого издания можно здесь.
notebooks
: содержит блокноты Jupyter для каждой главы книги.data
: Содержит наборы данных, используемые в записных книжках.images
: Содержит изображения и графики, используемые в блокнотах. Ниже приведен список блокнотов, включенных в каталог notebooks
, сгруппированный по главам книги.
Глава 2. Семантический поиск с помощью LLM
02_semantic_search.ipynb
: введение в семантический поиск с использованием OpenAI и моделей с открытым исходным кодом.Глава 3: Первые шаги с быстрым проектированием
03_prompt_engineering.ipynb
: Руководство по эффективному оперативному проектированию для LLM, ориентированных на инструкции.Глава 4. Экосистема искусственного интеллекта: собираем детали воедино
04_rag_retrieval.ipynb
: Создание конвейера дополненной генерации (RAG).04_agent.ipynb
: Создание ИИ-агента с использованием LLM и других инструментов. Глава 5. Оптимизация LLM с помощью индивидуальной тонкой настройки
05_bert_app_review.ipynb
: точная настройка модели BERT для классификации отзывов приложений.05_openai_app_review_fine_tuning.ipynb
: точная настройка моделей OpenAI для классификации отзывов приложений.Глава 6: Расширенное оперативное проектирование
06_adv_prompt_engineering.ipynb
: передовые методы оперативного проектирования, включая проверку выходных данных и семантическое обучение за несколько шагов.Глава 7: Настройка внедрений и архитектуры моделей
07_recommendation_engine.ipynb
: Создание механизма рекомендаций с использованием специально настроенных LLM и вложений. Глава 9: Выход за рамки базовых моделей
09_constructing_a_vqa_system.ipynb
: Пошаговое руководство по созданию системы визуального ответа на вопросы (VQA) с использованием GPT-2 и Vision Transformer.09_using_our_vqa.ipynb
: Использование системы VQA, встроенной в предыдущий блокнот.09_flan_t5_rl.ipynb
: использование обучения с подкреплением (RL) для улучшения выходных данных модели FLAN-T5.Глава 10: Расширенная точная настройка LLM с открытым исходным кодом
10_SAWYER_LLAMA_SFT.ipynb
: Точная настройка модели Llama-3 для создания бота SAWYER.10_SAWYER_Reward_Model.ipynb
: Обучение модели вознаграждения на основе предпочтений человека для бота SAWYER.10_SAWYER_RLF.ipynb
: применение обучения с подкреплением на основе обратной связи с человеком (RLHF) для настройки бота SAWYER.10_SAWYER_USE_SAWYER.ipynb
: Использование бота SAWYER.10_anime_category_classification_model_freezing.ipynb
: точная настройка модели BERT для классификации категорий аниме, сравнение методов замораживания слоев.10_latex_gpt2.ipynb
: точная настройка GPT-2 для генерации формул LaTeX.10_optimizing_fine_tuning.ipynb
: Рекомендации по оптимизации точной настройки моделей трансформаторов.Глава 11: Переход LLM к производству
11_distillation_example_1.ipynb
: Изучение методов дистилляции знаний для моделей трансформаторов.11_distillation_example_2.ipynb
: Расширенные методы и приложения дистилляции.11_llama_quantization.ipynb
: Квантование моделей Llama для эффективного развертывания.Глава 12: Оценка программ LLM
12_llm_calibration.ipynb
: Методы калибровки выходных данных LLM.12_llm_gen_eval.ipynb
: Методы оценки генеративных возможностей LLM.12_cluster.ipynb
: методы кластеризации для анализа результатов LLM.Чтобы использовать этот репозиторий:
git clone https://github.com/yourusername/quick-start-llms.git
cd quick-start-llms
pip install -r requirements.txt
Примечание. Для некоторых блокнотов могут потребоваться определенные наборы данных, которые можно найти в каталоге данных.
Вклады приветствуются! Если у вас есть какие-либо дополнения, исправления или улучшения, смело отправляйте запрос на включение.
Этот репозиторий предназначен для образовательных целей и предназначен для сопровождения книги «Краткое руководство по большим языковым моделям – второе издание». Пожалуйста, обратитесь к книге для получения подробных объяснений и обсуждений тем, затронутых в тетрадях.