Этот репозиторий содержит некоторые ресурсы, которые я буду использовать для изучения больших языковых моделей. Я также постараюсь разработать дорожную карту по мере продвижения в этом путешествии самообучения, поскольку четкая дорожная карта с указанием этапов будет одним из лучших способов правильно изучить LLM.
Для этого я включу сочетание теоретических и практических ресурсов для изучения.
PS: Нужно сделать это более наглядно.
Изменение: 6 ноября 2024 г.
Необходимо провести капитальный рефакторинг репозитория.
Удалите курсы или ресурсы, которые не имеют отношения к делу.
В гонке моделей мы не можем продолжать перечислять модели в репозитории, поскольку за ними сложно следить, а обновления сделают предыдущие модели бесполезными. Нужно придумать, как лучше организовать модельный зоопарк.
Возможно, добавьте 1-2 участников или откройте репозиторий для вкладов, чтобы помочь.
Как мы можем сделать это полезным опытом обучения, размещая заметки и учебные пособия, открытые обсуждения, веб-страницы?
CS224N Обработка естественного языка с глубоким обучением, Стэнфорд
Специализация по обработке естественного языка, Coursera
HuggingFace НЛП + Курс Трансформеры
CS25: Transformers United V2, Stanford CS25, версия осени 2021 г.
Activeloop Learn, эта инициатива GenAI360 предоставляет 3 бесплатных курса по RAG, тонкой настройке LLM, LangChain и VectorDB.
Курс LLM от Максима Лабонна, курс по изучению больших языковых моделей (LLM) с дорожными картами и блокнотами Colab.
Практический курс LLM. Узнайте о LLM, LLMOps и векторных базах данных бесплатно, разработав, обучив и развернув исходный код системы LLM финансового консультанта в режиме реального времени + видео и материалы для чтения.
Full Stack Deep Learning, который начинался как учебный курс по глубокому обучению и примерно в апреле 2023 года превратился в учебный курс LLM, теперь доступен бесплатно.
Этот курс LLM University от Cohere состоит из 8 модулей, которые преподает знаменитый Луис Серрано, который известен тем, что преподает концепции в простой и визуально привлекательной форме. Курс содержит такие темы, как основы, развертывание, семантический поиск и RAG.
Краткие курсы Deeplearning.ai, краткие курсы DL.AI по различным областям магистратуры и генеративного искусственного интеллекта. Эти короткие курсы действительно полезны, поскольку они представляют собой идеальное сочетание теоретических и практических занятий. Курсы обычно проводятся в сотрудничестве с такими компаниями, как Hugging Face, Mistral, OpenAI, Microsoft, Meta, Google и т. д.
LLM Zoomcamp от DataTalksClub, LLM Zoomcamp — бесплатный онлайн-курс по построению системы вопросов и ответов.
Курс Applied LLM Mastery 2024 от Айшварии Н. Реганти, бесплатный 10-недельный курс с четкой дорожной картой, начиная от основ LLM, инструментов и методов, развертывания и оценки до проблем и будущих тенденций.
Курсы «Вес и предвзятость»: различные курсы по MLOps, приложениям на базе LLM и т. д.
Курс LLM Models, редактирование DataBricks, профессиональная сертификация DataBricks.
Deeplearning.ai предлагает различные короткие курсы по LLM, таким как LangChain для разработки приложений LLM, бессерверные LLM с AWS Bedrock, тонкая настройка LLM, LLM с семантическим поиском и т. д.
Введение в курс обучения генеративному искусственному интеллекту, Google Cloud.
В Университете Аризе проводятся такие курсы, как llm-оценка, инструменты и цепочки агентов llm, llm-наблюдаемость и т. д.
Книга «Обработка естественного языка с помощью трансформеров»
Блоги Лангчейна
Блог AIMultiple о больших языковых моделях: полное руководство в 2023 году
Согласованные документы
Блог FutureSmart AI о создании чат-ботов с использованием LangChain и ChatGPT
Автономный агент, управляемый задачами, использующий GPT-4, Pinecone и LangChain для различных приложений
Обзор больших языковых моделей. Также посетите этот репозиторий: https://github.com/RUCAIBox/LLMSurvey.
Понимание больших языковых моделей: преобразующий список литературы, Себастьян Рашка
Wiki CLSP, Группа чтения НЛП, список групп чтения, связанных с НЛП, который часто обновляется.
Внутренняя история удивительного потенциала ChatGPT | Грег Брокман | ТЕД
Почему ИИ невероятно умен и шокирующе глуп | Еджин Чой | ТЕД
25 апреля 2023 г., Арисе: наблюдайте
27 апреля 2023 г., Тонкая настройка LLM с помощью PyTorch 2.0 и ChatGPT.
Организация H2O, HuggingFaces
Организация OpenAssistant, HuggingFaces
Организация DataBricks, HuggingFaces
Организация BigScience, HuggingFaces
Организация EleutherAI, HuggingFaces
Организация NomicAI, HuggingFaces
Организация Cerebras, HuggingFaces
LLMStudio, H2O AI
LLamaIndex
NeMo Guardrails, NVIDIA, для предотвращения галлюцинаций и добавления программируемых ограждений
MLC LLM, разработка, оптимизация и развертывание LLM на всех устройствах)
ЛаМини, LLM
ChatGPT, OpenAI, выпущен 30 ноября 2022 г.
Google Bard, выпущено 21 марта 2023 г.
Tongyi Qianwen AI, Alibaba, выпущено 11 апреля 2023 г.
StableLM, Stability AI, выпущен 20 апреля 2023 г.
Амазон Титан
HuggingChat, HuggingFaces, выпущено 25 апреля 2023 г.
H2OGPT
Модель Блума, коммерческое использование разрешено с RAIL
GPT-J, ЭлеутерАИ, Apache 2.0
GPT-NeoX, EleutherAI, Apache 2.0
GPT4All, NomicAI, лицензия MIT
GPT4All-J, NomicAI, лицензия MIT
Pythia, EleutherAI, лицензия MIT
ГЛМ-130Б
ПалМ, Google
ОПТ, Мета
ФЛАН-Т5
ЛЛаМА, Мета
Альпака, Стэнфорд
Викунья, lm-sys
ПоделитьсяGPT
Сосновая шишка
Плетение
Милвус
ChromaDB
BabyAGI
АвтоGPT
Люди, на которых вам обязательно следует подписаться, чтобы быть в курсе событий LLM. Исследователи/основатели/разработчики/создатели контента AI, участвующие в производстве/исследованиях/разработках LLM
Себастьян Рашка — легенда, и он лопнет ваш ажиотаж в сфере LLM своими потрясающими твитами, блогами и обучающими материалами. Подпишитесь на его рассылку Впереди AI
Андрей Карпати, эта легенда, работала в Tesla, взял перерыв, запустил свой канал на YouTube, чтобы обучать основам, поразил нас всех своим потрясающим видео о внедрении GPT с нуля и, наконец, вернулся в OpenAI. Думаю, легенду потерять невозможно :D
Джей Аламмар, да, если вы не знаете о его блоге ELI о Трансформерах, сначала прочитайте его и обязательно следите за его обновлениями.
Томаз Братаник, автор известной книги «Графовые алгоритмы для науки о данных», а в настоящее время ведет отличные блоги на Medium, посвященные GPT, Langchain и т. д.