Download Machine Learning with Python - download de código-fonte Machine Learning with Python

Machine Learning with Python

Código-Fonte de IA

1.0.0

Baixar

Notebooks Jupyter de aprendizado de máquina Python (site de ML)

Tirthajyoti Sarkar, Fremont, Califórnia (sinta-se à vontade para se conectar no LinkedIn aqui)

Confira também esses repositórios superúteis que fiz a curadoria

Artigos altamente citados e úteis relacionados ao aprendizado de máquina, aprendizado profundo, IA, teoria dos jogos, aprendizado por reforço
Links de recursos cuidadosamente selecionados para ciência de dados em um só lugar

Requisitos

Python 3.6+
NumPy ( pip install numpy )
Pandas ( pip install pandas )
Scikit-learn ( pip install scikit-learn )
SciPy ( pip install scipy )
Modelos de estatísticas ( pip install statsmodels )
MatplotLib ( pip install matplotlib )
Seaborn ( pip install seaborn )
Sympy ( pip install sympy )
Frasco ( pip install flask )
WTForms ( pip install wtforms )
Tensorflow ( pip install tensorflow>=1.15 )
Keras ( pip install keras )
pdpipe ( pip install pdpipe )

Você pode começar com este artigo que escrevi na revista Heartbeat (na plataforma Medium):

"Alguns truques e truques essenciais para aprendizado de máquina com Python"

Cadernos essenciais do tipo tutorial em Pandas e Numpy

Cadernos Jupyter cobrindo uma ampla gama de funções e operações sobre os tópicos NumPy, Pandans, Seaborn, Matplotlib etc.

Operações Numpy detalhadas
Operações detalhadas do Pandas
Noções básicas rápidas de Numpy e Pandas
Noções básicas rápidas de Matplotlib e Seaborn
Operações avançadas do Pandas
Como ler várias fontes de dados
Demonstração de leitura de PDF e processamento de tabelas
Quão rápidas são as operações Numpy em comparação com o código Python puro? (Leia meu artigo no Medium relacionado a este tópico)
Leitura rápida do Numpy usando o formato de arquivo .npy (leia meu artigo no Medium sobre este tópico)

Cadernos do tipo tutorial que cobrem regressão, classificação, agrupamento, redução de dimensionalidade e alguns algoritmos básicos de redes neurais

Regressão

Regressão linear simples com geração de estatística t

Múltiplas maneiras de realizar regressão linear em Python e sua comparação de velocidade (confira o artigo que escrevi no freeCodeCamp)
Regressão multivariada com regularização

Regressão polinomial usando o recurso de pipeline scikit-learn (confira o artigo que escrevi em Towards Data Science )
Árvores de decisão e regressão Random Forest (mostrando como a Random Forest funciona como um meta-estimador robusto/regularizado rejeitando overfitting)
Análise visual detalhada e testes de diagnóstico de adequação para um problema de regressão linear
Regressão linear robusta usando HuberRegressor do Scikit-learn

Classificação

Regressão/classificação logística (aqui está o caderno)

k -classificação do vizinho mais próximo (aqui está o caderno)
Árvores de decisão e classificação florestal aleatória (aqui está o caderno)
Classificação de máquinas de vetores de suporte (aqui está o Notebook) ( confira o artigo que escrevi em Rumo à ciência de dados sobre SVM e algoritmo de classificação)

Classificação Naive Bayes (aqui está o caderno)

Agrupamento

K -means clustering (aqui está o Notebook)
Propagação de afinidade (mostrando sua complexidade de tempo e o efeito do fator de amortecimento) (Aqui está o Notebook)
Técnica de mudança de média (mostrando sua complexidade de tempo e o efeito do ruído na descoberta de cluster) (aqui está o caderno)
DBSCAN (mostrando como ele pode detectar genericamente áreas de alta densidade, independentemente das formas do cluster, o que o k-means não consegue fazer) (Aqui está o Notebook)
Clustering hierárquico com dendogramas mostrando como escolher o número ideal de clusters (aqui está o notebook)

Redução de dimensionalidade

Análise de componentes principais

Aprendizado profundo/rede neural

Caderno de demonstração para ilustrar a superioridade da rede neural profunda para tarefas complexas de aproximação de função não linear
Construção passo a passo de rede densa de 1 camada oculta e 2 camadas ocultas usando métodos básicos do TensorFlow

Geração aleatória de dados usando expressões simbólicas

Como usar o pacote Sympy para gerar conjuntos de dados aleatórios usando expressões matemáticas simbólicas.
Aqui está meu artigo no Medium sobre este tópico: Regressão aleatória e geração de problemas de classificação com expressão simbólica

Técnicas de geração de dados sintéticos

Cadernos aqui

Exemplos simples de implantação (servindo modelos de ML na API da web)

Servindo um modelo de regressão linear por meio de uma interface de servidor HTTP simples. O usuário precisa solicitar previsões executando um script Python. Usa Flask e Gunicorn .
Servindo uma rede neural recorrente (RNN) por meio de uma página HTTP, completa com um formulário web, onde os usuários podem inserir parâmetros e clicar em um botão para gerar texto com base no modelo RNN pré-treinado. Usa Flask , Jinja , Keras / TensorFlow , WTForms .

Programação orientada a objetos com aprendizado de máquina

Implementar alguns dos princípios básicos de OOP em um contexto de aprendizado de máquina, construindo seu próprio estimador semelhante ao Scikit-learn e tornando-o melhor.

Veja meus artigos no Medium sobre este assunto.

Programação orientada a objetos para cientistas de dados: crie seu estimador de ML
Como uma simples combinação de programação orientada a objetos pode aprimorar seu protótipo de aprendizado profundo

Teste de unidade de código ML com Pytest

Verifique os arquivos e instruções detalhadas no diretório Pytest para entender como se deve escrever código/módulo de teste de unidade para modelos de aprendizado de máquina

Perfil de memória e tempo

Criar perfis de código de ciência de dados e modelos de ML para consumo de memória e tempo de computação é uma área crítica, mas muitas vezes negligenciada. Aqui estão alguns cadernos mostrando as ideias,