Este repositório constitui alguns dos recursos que utilizarei para aprender sobre grandes modelos de linguagem. Também tentarei elaborar um roteiro à medida que avanço nesta jornada de autoaprendizagem, uma vez que um roteiro claro com marcos será uma das melhores maneiras de aprender sobre LLMs de maneira adequada.
Para isso, incluirei uma combinação de recursos práticos teóricos e práticos para aprender.
PS: Preciso tornar isso mais visual
Editar: 6 de novembro de 2024
Precisa refatorar principalmente o repositório.
Remova cursos ou recursos que não sejam relevantes.
Na corrida de modelos, não podemos continuar listando modelos no repositório, pois é difícil acompanhar os modelos e as atualizações tornarão os modelos anteriores inúteis. Preciso pensar em uma maneira melhor de organizar um zoológico modelo.
Talvez adicione 1 ou 2 contribuidores ou abra o repositório para contribuições para ajudar.
Como podemos tornar isso uma ótima experiência de aprendizado, hospedando notas e tutoriais, discussões abertas, página da web?
Processamento de linguagem natural CS224N com aprendizado profundo, Stanford
Especialização em Processamento de Linguagem Natural, Coursera
Curso HuggingFace PNL + Transformadores
CS25: Transformers United V2, Stanford CS25, versão outono de 2021
Activeloop Learn, esta iniciativa GenAI360 oferece 3 cursos gratuitos sobre RAGs, LLMs de ajuste fino, LangChain e VectorDBs.
Curso LLM de Maxime Labonne, Curso para entrar em Large Language Models (LLMs) com roadmaps e cadernos Colab.
Curso prático LLM, aprenda sobre LLMs, LLMOps e Vector DBs gratuitamente, projetando, treinando e implantando um código-fonte do sistema LLM de consultor financeiro em tempo real + vídeo e materiais de leitura.
Full Stack Deep Learning, começou como um bootcamp de deep learning e evoluiu para um bootcamp LLM por volta de abril de 2023, agora é gratuito.
LLM University by Cohere, este curso é composto por 8 módulos ministrados pelo famoso Luis Serrano, que se destaca por ensinar conceitos de forma fácil e visualmente atraente. O curso contém tópicos como fundamentos, implantação, pesquisa semântica e RAG.
Cursos de curta duração Deeplearning.ai, cursos de curta duração da DL.AI em vários domínios de LLMs e IA generativa. Esses minicursos são muito úteis porque combinam perfeitamente sessões teóricas e práticas. Os cursos geralmente são realizados em colaboração com empresas como Hugging Face, Mistral, OpenAI, Microsoft, Meta, Google etc.
LLM Zoomcamp da DataTalksClub, LLM Zoomcamp - um curso online gratuito sobre a construção de um sistema de perguntas e respostas.
Curso LLMs Mastery 2024 aplicado por Aishwarya N Reganti, curso gratuito de 10 semanas com um roteiro definido que vai desde Fundamentos de LLM, ferramentas e técnicas, implantação e avaliação até desafios e tendências futuras.
Cursos de Pesos e Vieses, oferece diferentes cursos sobre MLOps, LLM Powered Apps, etc.
Curso LLM Models, DataBricks x ed, certificação profissional pela DataBricks.
Deeplearning.ai oferece vários cursos de curta duração em LLMs, como LangChain para desenvolvimento de aplicativos LLM, LLMs sem servidor com AWS Bedrock, LLMs de ajuste fino, LLMs com pesquisa semântica, etc.
Introdução ao caminho de aprendizagem de IA generativa, Google Cloud.
A Arize University hospeda cursos como avaliação de llm, ferramentas e cadeias de agentes llm, observabilidade de llm, etc.
Livro Processamento de Linguagem Natural com Transformers
Blogs da Langchain
Blog da AIMultiple sobre grandes modelos de linguagem: guia completo em 2023
Cohere Documentos
Blog FutureSmart AI sobre construção de chatbots usando LangChain e ChatGPT
Agente autônomo orientado a tarefas utilizando GPT-4, Pinecone e LangChain para diversas aplicações
Uma pesquisa de grandes modelos de linguagem Confira também este repositório: https://github.com/RUCAIBox/LLMSurvey
Compreendendo grandes modelos de linguagem – Uma lista de leitura transformadora, Sebastian Raschka
Wiki CLSP, NLP Reading Group, uma lista de grupos de leitura relacionados à PNL que é atualizada frequentemente.
A história interna do potencial surpreendente do ChatGPT | Greg Brockman | TED
Por que a IA é incrivelmente inteligente – e chocantemente estúpida | Yejin Choi | TED
25 de abril de 2023, Arize: Observe
27 de abril de 2023, LLMs de ajuste fino com PyTorch 2.0 e ChatGPT
Organização H2O, HuggingFaces
Organização OpenAssistant, HuggingFaces
Organização DataBricks, HuggingFaces
Organização BigScience, HuggingFaces
Organização EleutherAI, HuggingFaces
Organização NomicAI, HuggingFaces
Organização Cerebras, HuggingFaces
LLMStudio, H2O AI
LLamaIndex
NeMo Guardrails, NVIDIA, para evitar alucinações e adicionar guarda-corpos programáveis
MLC LLM, desenvolver, otimizar e implantar LLMs nativamente nos dispositivos de todos)
LaMini LLM
ChatGPT, OpenAI, lançado em 30 de novembro de 2022
Google Bard, lançado em 21 de março de 2023
Tongyi Qianwen AI, Alibaba, lançado em 11 de abril de 2023
StableLM, Stability AI, lançado em 20 de abril de 2023
Amazona Titã
HuggingChat, HuggingFaces, lançado em 25 de abril de 2023
H2OGPT
Modelo Bloom, uso comercial permitido com RAIL
GPT-J, EleutherAI, Apache 2.0
GPT-NeoX, EleutherAI, Apache 2.0
Licença GPT4All, NomicAI, MIT
Licença GPT4All-J, NomicAI, MIT
Pythia, EleutherAI, licença MIT
GLM-130B
PaLM, Google
OPTAR, Meta
FLAN-T5
LLaMA, Meta
Alpaca, Stanford
Vicuna, lm-sys
CompartilharGPT
Pinha
Tecer
Milvus
ChromaDB
BebêAGI
AutoGPT
Pessoas que você definitivamente deveria seguir para se manter atualizado sobre os LLMs. Pesquisadores/fundadores/desenvolvedores/criadores de conteúdo de IA envolvidos na produção/pesquisa/desenvolvimento de LLM
Sebastian Raschka, ele é uma lenda e vai estourar sua bolha de LLM com seus tweets, blogs e tutoriais incríveis. Assine seu boletim informativo Ahead of AI
Andrej Karpathy, então essa lenda trabalhou na Tesla, fez uma pausa, iniciou seu canal no YouTube para ensinar os fundamentos e surpreendeu a todos nós com seu vídeo incrível sobre a implementação do GPT do zero e finalmente voltou ao OpenAI. Acho que você não pode perder uma lenda :D
Jay Alammar, sim, se você não conhece o blog ELI dele sobre Transformers, leia-o primeiro e certifique-se de segui-lo para atualizações.
Tomaz Bratanic, ele é o autor do famoso livro Graph Algorithms for Data Science, e atualmente escreve ótimos blogs no Medium relacionados a GPT, Langchain e outras coisas.