Machine Learning with Python Télécharger - Machine Learning with Python Téléchargement du code source

Machine Learning with Python

Code Source AI

1.0.0

Télécharger

Python Machine Learning Jupyter Notebooks (site Web ML)

Dr Tirthajyoti Sarkar, Fremont, Californie (N'hésitez pas à vous connecter sur LinkedIn ici)

Découvrez également ces dépôts super utiles que j'ai organisés

Articles très cités et utiles liés à l'apprentissage automatique, à l'apprentissage profond, à l'IA, à la théorie des jeux et à l'apprentissage par renforcement.
Liens de ressources soigneusement sélectionnés pour la science des données en un seul endroit

Exigences

Python3.6+
NumPy ( pip install numpy )
Pandas ( pip install pandas )
Scikit-learn ( pip install scikit-learn )
SciPy ( pip install scipy )
Modèles de statistiques ( pip install statsmodels )
MatplotLib ( pip install matplotlib )
Seaborn ( pip install seaborn )
Sympy ( pip install sympy )
Flacon ( pip install flask )
WTForms ( pip install wtforms )
Tensorflow ( pip install tensorflow>=1.15 )
Keras ( pip install keras )
pdpipe ( pip install pdpipe )

Vous pouvez commencer par cet article que j'ai écrit dans le magazine Heartbeat (sur la plateforme Medium) :

"Quelques astuces et astuces essentielles pour l'apprentissage automatique avec Python"

Cahiers essentiels de type tutoriel sur Pandas et Numpy

Carnets Jupyter couvrant un large éventail de fonctions et d'opérations sur les thèmes de NumPy, Pandans, Seaborn, Matplotlib etc.

Opérations Numpy détaillées
Opérations Pandas détaillées
Bases rapides de Numpy et Pandas
Bases rapides de Matplotlib et Seaborn
Opérations Pandas avancées
Comment lire diverses sources de données
Démo de lecture de PDF et de traitement de tableaux
Quelle est la rapidité des opérations Numpy par rapport au code Python pur ? (Lire mon article sur Medium lié à ce sujet)
Lecture rapide depuis Numpy en utilisant le format de fichier .npy (Lisez mon article sur Medium sur ce sujet)

Cahiers de type didacticiel couvrant la régression, la classification, le clustering, la réduction de dimensionnalité et certains algorithmes de base des réseaux neuronaux

Régression

Régression linéaire simple avec génération de statistiques t

Plusieurs façons d'effectuer une régression linéaire en Python et leur comparaison de vitesse (consultez l'article que j'ai écrit sur freeCodeCamp)
Régression multivariée avec régularisation

Régression polynomiale utilisant la fonctionnalité de pipeline scikit-learn (consultez l'article que j'ai écrit sur Towards Data Science )
Arbres de décision et régression Random Forest (montrant comment Random Forest fonctionne comme un méta-estimateur robuste/régularisé rejetant le surajustement)
Analyses visuelles détaillées et tests de diagnostic d'adéquation pour un problème de régression linéaire
Régression linéaire robuste utilisant HuberRegressor de Scikit-learn

Classification

Régression/classification logistique (Voici le cahier)

k -classification du voisin le plus proche (Voici le cahier)
Arbres de décision et classification aléatoire des forêts (voici le cahier)
Prise en charge de la classification des machines vectorielles (voici le cahier) ( consultez l'article que j'ai écrit dans Towards Data Science sur SVM et l'algorithme de tri)

Classification Naive Bayes (Voici le Carnet)

Regroupement

K -signifie clustering (Voici le cahier)
Propagation d'affinité (montrant sa complexité temporelle et l'effet du facteur d'amortissement) (Voici le cahier)
Technique de décalage moyen (montrant sa complexité temporelle et l'effet du bruit sur la découverte de clusters) (Voici le carnet)
DBSCAN (montrant comment il peut détecter de manière générique des zones de haute densité indépendamment de la forme des clusters, ce que les k-means ne parviennent pas à faire) (Voici le cahier)
Clustering hiérarchique avec des dendogrammes montrant comment choisir le nombre optimal de clusters (Voici le cahier)

Réduction de dimensionnalité

Analyse en composantes principales

Apprentissage profond/réseau neuronal

Carnet de démonstration pour illustrer la supériorité du réseau neuronal profond pour une tâche complexe d'approximation de fonctions non linéaires
Création étape par étape d'un réseau dense à 1 couche cachée et à 2 couches cachées à l'aide des méthodes TensorFlow de base

Génération de données aléatoires à l'aide d'expressions symboliques

Comment utiliser le package Sympy pour générer des ensembles de données aléatoires à l'aide d'expressions mathématiques symboliques.
Voici mon article sur Medium sur ce sujet : Génération de problèmes de régression aléatoire et de classification avec expression symbolique

Techniques de génération de données synthétiques

Cahiers ici

Exemples de déploiement simples (diffusion de modèles ML sur l'API Web)

Servir un modèle de régression linéaire via une simple interface de serveur HTTP. L'utilisateur doit demander des prédictions en exécutant un script Python. Utilise Flask et Gunicorn .
Servir un réseau neuronal récurrent (RNN) via une page Web HTTP, complétée par un formulaire Web, où les utilisateurs peuvent saisir des paramètres et cliquer sur un bouton pour générer du texte basé sur le modèle RNN pré-entraîné. Utilise Flask , Jinja , Keras / TensorFlow , WTForms .

Programmation orientée objet avec apprentissage automatique

Mettre en œuvre certains des principes fondamentaux de la POO dans un contexte d'apprentissage automatique en créant votre propre estimateur de type Scikit-learn et en l'améliorant.

Voir mes articles sur Medium sur ce sujet.

Programmation orientée objet pour les data scientists : créez votre estimateur ML
Comment un simple mélange de programmation orientée objet peut affiner votre prototype d'apprentissage en profondeur

Tests unitaires du code ML avec Pytest

Consultez les fichiers et les instructions détaillées dans le répertoire Pytest pour comprendre comment écrire le code/module de test unitaire pour les modèles d'apprentissage automatique.

Profilage de mémoire et de synchronisation

Le profilage du code de science des données et des modèles ML pour l'empreinte mémoire et le temps de calcul est un domaine critique mais souvent négligé. Voici quelques cahiers montrant les idées,