Téléchargement ML foundations - ML foundations Téléchargement du code source

ML foundations

Python

1.0.0

Télécharger

Fondements de l'apprentissage automatique

Ce dépôt héberge le code qui accompagne le programme Machine Learning Foundations de Jon Krohn, qui fournit un aperçu complet de tous les sujets (mathématiques, statistiques et informatique) qui sous-tendent les approches contemporaines d'apprentissage automatique, y compris l'apprentissage profond et d'autres intelligences artificielles. techniques.

Le programme comprend huit matières, organisées en quatre domaines. Consultez la section « Machine Learning House » ci-dessous pour savoir pourquoi il s'agit de domaines fondamentaux essentiels :

Algèbre linéaire
- 1 : Introduction à l'algèbre linéaire
- 2 : Algèbre linéaire II : Opérations matricielles
Calcul
- 3 : Calcul I : Limites et dérivées
- 4 : Calcul II : Dérivées partielles et intégrales
Probabilités et statistiques
- 5 : Théorie des probabilités et de l’information
- 6 : Introduction aux statistiques
L'informatique
- 7 : Algorithmes et structures de données
- 8 : Optimisation

Les matières ultérieures s'appuient sur le contenu des matières précédentes, l'approche recommandée consiste donc à progresser dans les huit matières dans l'ordre indiqué. Cela dit, vous êtes invités à choisir des sujets individuels en fonction de votre intérêt ou de votre familiarité avec le matériel. En particulier, chacun des quatre domaines est assez indépendant et pourrait donc être abordé séparément.

Où et quand

Les huit sujets ML Foundations ont été initialement proposés par Jon Krohn sous forme de formations en ligne en direct sur la plateforme d'apprentissage O'Reilly de mai à septembre 2020 (et ont été proposés une deuxième fois de juillet à décembre 2021 ; voir ici pour les dates de cours individuelles).

Pour s'adapter à votre mode d'apprentissage préféré, le contenu est désormais disponible via plusieurs canaux :

YouTube
- Playlist complète d'algèbre linéaire ici et article de blog détaillé ici
- Playlist complète de calcul ici
- La playlist de probabilités est en développement actif (inscrivez-vous à ma newsletter par e-mail sur jonkrohn.com pour être informé des nouvelles sorties vidéo)
- Avec le temps, toutes les matières de mon programme ML Foundations seront disponibles gratuitement sur YouTube.
O'Reilly (de nombreux employeurs et établissements d'enseignement offrent un accès gratuit à cette plateforme ; si vous n'y avez pas accès, vous pouvez bénéficier d'un essai gratuit de 30 jours via mon code spécial SDSPOD23)
- Vidéos d'algèbre linéaire publiées en décembre 2020 (cours gratuit d'une heure)
- Vidéos de calcul publiées en janvier 2021 (cours gratuit d'une heure)
- Vidéos de probabilités et de statistiques publiées en mai 2021 (cours gratuit d'une heure)
- Vidéos d'informatique publiées en juin 2021 (cours gratuit d'une heure)
- (Pour plus de commodité, cet éditeur a compilé ici les 28 heures des quatre séries de vidéos ci-dessus dans une seule liste de lecture.)
Udemy : Tout le contenu de l'algèbre linéaire et du calcul est disponible dans un cours Fondements mathématiques du ML depuis septembre 2021 (vidéo de présentation gratuite ici). Bien que ce cours constitue à lui seul une introduction complète aux matières mathématiques, les matières 5 à 8 seront éventuellement ajoutées en tant que matériel bonus gratuit.
Conférence Open Data Science : L'intégralité de la série a été dispensée en direct en ligne de décembre 2020 à juin 2021. Les enregistrements à la demande de toutes ces formations sont désormais disponibles sur la plateforme Ai+.
Livre : Un contrat de livre avec Pearson est en place ; à terme, j'aurai de la bande passante pour travailler sur le manuscrit et les versions préliminaires des chapitres seront disponibles via oreilly.com.

(Notez que même si YouTube contient 100 % du contenu enseigné, les options payantes, par exemple Udemy, O'Reilly et ODSC, contiennent des solutions complètes pour des exercices qui ne sont pas disponibles sur YouTube. Certaines des options payantes incluent également des fonctionnalités exclusives et spécifiques à la plateforme telles que des tests interactifs, des « aide-mémoire » et l'attribution d'un certificat pour la réussite du cours.)

Notifications poussées

Pour rester informé des futures sessions de formation en direct, des nouvelles sorties vidéo et des sorties de chapitres de livres, pensez à vous inscrire à la newsletter électronique de Jon Krohn via sa page d'accueil.

Carnets

Tout le code est fourni dans les notebooks Jupyter de ce répertoire. Ces blocs-notes sont destinés à être utilisés dans l'environnement cloud (gratuit) Colab et c'est le seul environnement actuellement activement pris en charge.

Cela dit, si vous êtes habitué à exécuter des notebooks Jupyter localement, vous êtes invités à le faire (notez que les versions de bibliothèque dans le Dockerfile de ce dépôt ne sont pas nécessairement à jour, mais peuvent fournir un point de départ raisonnable pour exécuter Jupyter dans un conteneur Docker) .

La maison de l’apprentissage automatique

Pour être un data scientist ou un ingénieur ML exceptionnel, il ne suffit pas de savoir utiliser les algorithmes ML via les interfaces abstraites fournies par les bibliothèques les plus populaires (par exemple, scikit-learn, Keras). Pour former des modèles innovants ou les déployer pour qu'ils fonctionnent de manière performante en production, une appréciation approfondie de la théorie de l'apprentissage automatique (représentée comme l'étage central violet de la « Machine Learning House ») peut être utile, voire essentielle. Et, pour cultiver une appréciation aussi approfondie du ML, il faut posséder une compréhension pratique des sujets fondamentaux.

Lorsque les fondations de la « Machine Learning House » sont solides, il est également beaucoup plus facile de passer des principes généraux du ML (étage violet) aux domaines spécialisés du ML (le dernier étage, représenté en gris) tels que l'apprentissage profond, l'apprentissage naturel. traitement du langage, vision industrielle et apprentissage par renforcement. En effet, plus l'application est spécialisée, plus il est probable que les détails de sa mise en œuvre ne soient disponibles que dans des articles universitaires ou des manuels de niveau universitaire, qui supposent généralement une compréhension des sujets fondamentaux.

Le contenu de cette série peut être particulièrement pertinent pour vous si :

Vous utilisez des bibliothèques logicielles de haut niveau pour entraîner ou déployer des algorithmes d'apprentissage automatique et souhaitez maintenant comprendre les principes fondamentaux qui sous-tendent les abstractions, vous permettant ainsi d'étendre vos capacités.
Vous êtes un data scientist et souhaitez renforcer votre compréhension des sujets au cœur de votre discipline professionnelle
Vous êtes un développeur de logiciels et souhaitez développer une base solide pour le déploiement d'algorithmes d'apprentissage automatique dans les systèmes de production.
Vous êtes un analyste de données ou un passionné d'IA qui aimerait devenir data scientist ou ingénieur data/ML, et vous souhaitez donc comprendre en profondeur le domaine dans lequel vous entrez (très sage de votre part !)
Vous souhaitez simplement comprendre les bases de l'algèbre linéaire, du calcul, des probabilités, des statistiques, des algorithmes et/ou des structures de données.

Les sujets fondamentaux sont restés largement inchangés au cours des dernières décennies et le resteront probablement dans les décennies à venir, mais ils sont essentiels dans toutes les approches d'apprentissage automatique et de science des données. Ainsi, les fondations constituent une base solide pour toute la carrière.

Approche pédagogique

Le but de cette série est de vous fournir une compréhension pratique et fonctionnelle du contenu couvert. Le contexte sera donné pour chaque sujet, soulignant sa pertinence pour l'apprentissage automatique.

Comme pour d'autres documents créés par Jon Krohn (tels que le livre Deep Learning Illustrated et sa série vidéo de 18 heures Deep Learning with TensorFlow, Keras et PyTorch) , le contenu de la série prend vie grâce à la combinaison de :

Illustrations aux couleurs vives
Exercices de compréhension papier-crayon avec solutions entièrement travaillées
Des centaines d'exemples simples de code Python dans des notebooks Jupyter pratiques (avec un accent particulier sur les bibliothèques PyTorch et TensorFlow)
Applications pratiques de ML
Des ressources pour approfondir encore plus les sujets qui piquent votre curiosité

Conditions préalables

Programmation : toutes les démos de code seront en Python, donc une expérience avec celui-ci ou avec un autre langage de programmation orienté objet serait utile pour suivre les exemples de code. Une bonne (et gratuite !) ressource pour démarrer avec Python est Automate the Boring Stuff d'Al Sweigart.

Mathématiques : La familiarité avec les mathématiques du niveau secondaire facilitera le suivi de la classe. Si vous êtes à l’aise avec des informations quantitatives – comme comprendre des graphiques et réorganiser des équations simples – alors vous devez être bien préparé à suivre toutes les mathématiques. Si vous découvrez que vous avez des lacunes en mathématiques pendant que vous suivez ce programme ML Foundations , je vous recommande la Khan Academy gratuite et complète pour combler ces lacunes.