? Ranked as one of the top data science repositories on GitHub!
Técnicas, ferramentas, melhores práticas e tudo que você precisa para aprender aprendizado de máquina!
Complete Machine Learning Package é um repositório abrangente contendo 35 notebooks sobre programação Python, manipulação de dados, análise de dados, visualização de dados, limpeza de dados, aprendizado de máquina clássico, visão computacional e processamento de linguagem natural (PNL).
Todos os cadernos foram criados pensando nos leitores. Cada notebook começa com uma visão geral de alto nível de qualquer algoritmo/conceito específico que está sendo abordado. Sempre que possível, recursos visuais são usados para deixar as coisas claras.
10 de maio de 2023: Adicionado um guia completo sobre MLOps. Aproveite o guia!!
23 de junho de 2022: Muitas pessoas perguntaram como podem apoiar o pacote. Você pode nos pagar um café ☕️
18 de maio de 2022: O pacote completo de aprendizado de máquina já está disponível na web. Agora é fácil visualizar todos os cadernos!
9 de abril de 2022: Aprendizagem por transferência atualizada com redes neurais convolucionais pré-treinadas com itens adicionais e recursos adicionais.
25 de novembro de 2021: Fundamentos de aprendizado de máquina atualizados: notas introdutórias, fluxo de trabalho de design de sistema de ML e desafios de sistemas de aprendizagem adicionados.
A seguir estão as ferramentas abordadas no pacote completo de aprendizado de máquina. São ferramentas populares que a maioria dos engenheiros de aprendizado de máquina e cientistas de dados precisam de uma forma ou de outra no dia a dia.
Python é uma linguagem de programação de alto nível que ganhou muita popularidade na comunidade de dados e com o rápido crescimento das bibliotecas e frameworks, esta é a linguagem de programação certa para fazer ML.
NumPy é uma ferramenta de computação científica usada para operações de array ou matriz.
Pandas é uma ferramenta excelente e simples para analisar e manipular dados de diversas fontes diferentes.
Matplotlib é uma ferramenta abrangente de visualização de dados usada para criar visualizações estáticas, animadas e interativas em Python.
Seaborn é outra ferramenta de visualização de dados construída sobre Matplotlib que é bastante simples de usar.
Scikit-Learn: em vez de construir modelos de aprendizado de máquina do zero, o Scikit-Learn facilita o uso de modelos clássicos em poucas linhas de código. Esta ferramenta é adaptada por quase toda a comunidade e indústrias de ML, desde as startups às grandes tecnologias.
TensorFlow e Keras para aprendizado profundo: TensorFlow é uma estrutura popular de aprendizado profundo usada para construir modelos adequados para diferentes campos, como visão computacional e processamento de linguagem natural. Keras é uma API de rede neural de alto nível que facilita o design de modelos de aprendizado profundo. TensorFlow e Keras têm uma grande comunidade e ecossistema que inclui ferramentas como TensorBoard, TF Datasets, TensorFlow Lite, TensorFlow Extended, TensorFlow Hub, TensorFlow.js, TensorFlow GNN e muito mais.
[ Você pode encontrar notas detalhadas sobre NumPy aqui ]
Análise Exploratória de Dados
Introdução à preparação de dados
Lidando com recursos categóricos
Dimensionamento de recursos
Lidando com valores ausentes
Introdução ao Scikit-Learn para aprendizado de máquina
Modelos Lineares para Regressão
Modelos Lineares para Classificação
Máquinas de vetores de suporte: introdução e regressão
Máquinas de vetores de suporte para classificação
Árvores de decisão: introdução e regressão
Árvores de Decisão para Classificação
Florestas Aleatórias: Introdução e Regressão
Florestas Aleatórias para Classificação
Além das florestas aleatórias: mais modelos de conjunto
Introdução à aprendizagem não supervisionada com clustering KMeans
Uma introdução prática à análise de componentes principais
Introdução às redes neurais artificiais
Por que aprendizado profundo
Uma rede neural de camada única
Funções de ativação
Tipos de arquiteturas de aprendizagem profunda
Desafios no treinamento de redes neurais profundas
Introdução ao TensorFlow para aprendizado profundo
Redes Neurais para Regressão com TensorFlow
Redes Neurais para Classificação com TensorFlow
Introdução à visão computacional com redes neurais convolucionais (CNNs)
ConvNets para dados do mundo real e aumento de imagens
Transferir aprendizagem com redes neurais convolucionais pré-treinadas
[Caderno atualizado de aprendizagem por transferência pode ser encontrado aqui]
Introdução à PNL e processamento de texto com TensorFlow
Usando incorporações de palavras para representar textos
Redes Neurais Recorrentes (RNNs)
Usando redes neurais convolucionais para classificação de textos
Usando BERT pré-treinado para classificação de texto
Muitos dos conjuntos de dados usados para este repositório são das seguintes fontes:
A comunidade de aprendizado de máquina é muito vibrante. O pacote completo de aprendizado de máquina pode ajudar você a começar, mas não é suficiente. Felizmente, existem muitos recursos de aprendizagem fabulosos, alguns dos quais são pagos ou estão disponíveis gratuitamente. Aqui está uma lista de cursos que são frequentemente recomendados por muitas pessoas. Observe que eles não estão listados na ordem em que devem ser realizados.
Aprendizado de máquina do Coursera : Este curso foi ministrado por Andrew Ng. É um dos cursos de aprendizado de máquina mais populares, já frequentado por mais de 4 milhões de pessoas. O curso se concentra mais nos fundamentos das técnicas e algoritmos de aprendizado de máquina. É gratuito no Coursera.
Especialização em Deep Learning : Também ministrada por Andrew Ng., Deep Learning Specialization também é um curso baseado em fundamentos. Ele ensina fundamentos decentes das principais arquiteturas de aprendizado profundo, como redes neurais convolucionais e redes neurais recorrentes. O curso completo pode ser auditado no Coursera, ou assistido gratuitamente no Youtube.
Introdução ao aprendizado profundo do MIT : Este curso fornece os fundamentos do aprendizado profundo em um período de tempo razoavelmente curto. Cada palestra dura uma hora ou menos, mas os materiais ainda são os melhores das aulas. Confira a página do curso aqui e os vídeos das palestras aqui.
Introdução à IA centrada em dados do MIT : Este é o primeiro curso sobre DCAI. Esta aula cobre algoritmos para encontrar e corrigir problemas comuns em dados de ML e para construir melhores conjuntos de dados, concentrando-se em dados usados em tarefas de aprendizagem supervisionada, como classificação. Todo o material ensinado neste curso é altamente prático, focado em aspectos impactantes de aplicações de ML do mundo real, em vez de detalhes matemáticos de como modelos específicos funcionam. Você pode fazer este curso para aprender técnicas práticas não abordadas na maioria das aulas de ML, o que ajudará a mitigar o problema de “entra lixo, sai lixo” que assola muitos aplicativos de ML do mundo real. Confira a página do curso aqui, vídeos de palestras aqui e trabalhos de laboratório aqui.
NYU Deep Learning Spring 2021 : Ministrado na NYU por Yann LeCun, Alfredo Canziani, este curso é um dos cursos mais criativos que existem. Os materiais são apresentados de forma incrível. Confira os vídeos das palestras aqui e o repositório do curso aqui.
CS231N: Redes Neurais Convolucionais para Reconhecimento Visual de Stanford : CS231N é um dos melhores cursos de aprendizado profundo e visão computacional. A versão 2017 foi ministrada por Fei-Fei Li, Justin Johnson e Serena Yeung. A versão 2016 foi ministrada por Fei-Fei, Johnson e Andrej Karpathy. Veja os vídeos das palestras de 2017 aqui e outros materiais aqui.
CS224N: Processamento de Linguagem Natural com Aprendizado Profundo de Stanford : Se você está interessado em Processamento de Linguagem Natural, este é um ótimo curso para fazer. É ministrado por Christopher Manning, uma das estrelas da PNL de classe mundial. Veja aqui os vídeos das palestras.
Aprendizado profundo prático para codificadores por fast.ai : Este também é um curso intensivo de aprendizado profundo que cobre todo o espectro de arquiteturas e técnicas de aprendizado profundo. Os vídeos das palestras e outros recursos como cadernos ficam na página do curso.
Especialização em Engenharia de Aprendizado de Máquina para Produção (MLOps) : Ministrado por Andrew Ng., Laurence Moroney e Robert Crowe, este é um dos melhores cursos de engenharia de ML. Ele ensina como projetar sistemas de produção de aprendizado de máquina de ponta a ponta, construindo dados eficientes e pipelines de modelagem e implantando modelos na produção. Você pode encontrar o curso no Coursera e outros materiais do curso no Github.
Full Stack Deep Learning : Embora a maioria dos cursos de aprendizado de máquina se concentre na modelagem, este curso se concentra no envio de sistemas de aprendizado de máquina. Ele ensina como projetar projetos de aprendizado de máquina, gerenciamento de dados (armazenamento, acesso, processamento, controle de versão e rotulagem), treinamento, depuração e implantação de modelos de aprendizado de máquina. Veja a versão 2021 aqui e a 2019 aqui. Você também pode folhear as vitrines do projeto para ver o tipo de resultados dos cursos por meio dos projetos dos alunos.
Abaixo estão alguns livros incríveis sobre aprendizado de máquina.
O livro de aprendizado de máquina de cem páginas : de autoria de Andriy Burkov, este é um dos livros mais curtos, mas concisos e bem escritos que você encontrará na Internet. Você pode ler o livro gratuitamente aqui.
Engenharia de aprendizado de máquina : também de autoria de Andriy Burkov, este é outro excelente livro de aprendizado de máquina que revela cada etapa do fluxo de trabalho de aprendizado de máquina, desde a coleta de dados, preparação... até o serviço e manutenção do modelo. O livro também é gratuito aqui.
Desejo de aprendizado de máquina : de autoria de Andrew Ng., o livro contém várias estratégias para construir sistemas de aprendizagem eficazes. Ele é dividido em pequenas partes, o que facilita a leitura e não é difícil para engenheiros de aprendizado de máquina. Qualquer pessoa que trabalhe com equipes de ciência de dados e aprendizado de máquina pode achar o livro útil. O livro oficial está disponível aqui gratuitamente, mas você pode lê-lo ou baixá-lo aqui sem precisar se inscrever.
Aprendizado de máquina prático com Scikit-Learn, Keras e TensorFlow : de autoria de Aurelion Geron, este é um dos melhores livros de aprendizado de máquina. Está claramente escrito e cheio de ideias e melhores práticas. Você pode obter o livro aqui ou ver seu repositório aqui.
Aprendizado profundo : de autoria de três lendas do aprendizado profundo, Ian Goodfellow e Yoshua Bengio e Aaron Courville, este é um dos grandes livros de aprendizado profundo que está disponível gratuitamente. Você pode obtê-lo aqui.
Aprendizado profundo com Python : de autoria de François Chollet, designer do Keras, este é um livro de aprendizado profundo muito abrangente. Você pode obter o livro aqui e o repositório do livro aqui.
Mergulhe no aprendizado profundo : este também é um ótimo livro de aprendizado profundo que está disponível gratuitamente. O livro usa PyTorch e TensorFlow. Você pode ler o livro inteiro aqui.
Redes Neurais e Aprendizado Profundo : Este também é outro excelente livro online de aprendizado profundo de Michael Nielsen. Você pode ler o livro inteiro aqui.
Se você estiver interessado em mais recursos de aprendizado de máquina e aprendizado profundo, você pode encontrá-los aqui, aqui e aqui
@article{Nyandwi2021MLPackage,
title = "Complete Machine Learning Package",
author = "Nyandwi, Jean de Dieu",
journal = "GitHub",
year = "2021",
url = "https://nyandwi.com/machine_learning_complete",
}
Este repositório foi criado por Jean de Dieu Nyandwi. Você pode encontrá-lo no Twitter, LinkedIn, Medium e Instagram.