Ce dépôt héberge le code qui accompagne le programme Machine Learning Foundations de Jon Krohn, qui fournit un aperçu complet de tous les sujets (mathématiques, statistiques et informatique) qui sous-tendent les approches contemporaines d'apprentissage automatique, y compris l'apprentissage profond et d'autres intelligences artificielles. techniques.
Le programme comprend huit matières, organisées en quatre domaines. Consultez la section « Machine Learning House » ci-dessous pour savoir pourquoi il s'agit de domaines fondamentaux essentiels :
Les matières ultérieures s'appuient sur le contenu des matières précédentes, l'approche recommandée consiste donc à progresser dans les huit matières dans l'ordre indiqué. Cela dit, vous êtes invités à choisir des sujets individuels en fonction de votre intérêt ou de votre familiarité avec le matériel. En particulier, chacun des quatre domaines est assez indépendant et pourrait donc être abordé séparément.
Les huit sujets ML Foundations ont été initialement proposés par Jon Krohn sous forme de formations en ligne en direct sur la plateforme d'apprentissage O'Reilly de mai à septembre 2020 (et ont été proposés une deuxième fois de juillet à décembre 2021 ; voir ici pour les dates de cours individuelles).
Pour s'adapter à votre mode d'apprentissage préféré, le contenu est désormais disponible via plusieurs canaux :
(Notez que même si YouTube contient 100 % du contenu enseigné, les options payantes, par exemple Udemy, O'Reilly et ODSC, contiennent des solutions complètes pour des exercices qui ne sont pas disponibles sur YouTube. Certaines des options payantes incluent également des fonctionnalités exclusives et spécifiques à la plateforme telles que des tests interactifs, des « aide-mémoire » et l'attribution d'un certificat pour la réussite du cours.)
Pour rester informé des futures sessions de formation en direct, des nouvelles sorties vidéo et des sorties de chapitres de livres, pensez à vous inscrire à la newsletter électronique de Jon Krohn via sa page d'accueil.
Tout le code est fourni dans les notebooks Jupyter de ce répertoire. Ces blocs-notes sont destinés à être utilisés dans l'environnement cloud (gratuit) Colab et c'est le seul environnement actuellement activement pris en charge.
Cela dit, si vous êtes habitué à exécuter des notebooks Jupyter localement, vous êtes invités à le faire (notez que les versions de bibliothèque dans le Dockerfile de ce dépôt ne sont pas nécessairement à jour, mais peuvent fournir un point de départ raisonnable pour exécuter Jupyter dans un conteneur Docker) .
Pour être un data scientist ou un ingénieur ML exceptionnel, il ne suffit pas de savoir utiliser les algorithmes ML via les interfaces abstraites fournies par les bibliothèques les plus populaires (par exemple, scikit-learn, Keras). Pour former des modèles innovants ou les déployer pour qu'ils fonctionnent de manière performante en production, une appréciation approfondie de la théorie de l'apprentissage automatique (représentée comme l'étage central violet de la « Machine Learning House ») peut être utile, voire essentielle. Et, pour cultiver une appréciation aussi approfondie du ML, il faut posséder une compréhension pratique des sujets fondamentaux.
Lorsque les fondations de la « Machine Learning House » sont solides, il est également beaucoup plus facile de passer des principes généraux du ML (étage violet) aux domaines spécialisés du ML (le dernier étage, représenté en gris) tels que l'apprentissage profond, l'apprentissage naturel. traitement du langage, vision industrielle et apprentissage par renforcement. En effet, plus l'application est spécialisée, plus il est probable que les détails de sa mise en œuvre ne soient disponibles que dans des articles universitaires ou des manuels de niveau universitaire, qui supposent généralement une compréhension des sujets fondamentaux.
Le contenu de cette série peut être particulièrement pertinent pour vous si :
Les sujets fondamentaux sont restés largement inchangés au cours des dernières décennies et le resteront probablement dans les décennies à venir, mais ils sont essentiels dans toutes les approches d'apprentissage automatique et de science des données. Ainsi, les fondations constituent une base solide pour toute la carrière.
Le but de cette série est de vous fournir une compréhension pratique et fonctionnelle du contenu couvert. Le contexte sera donné pour chaque sujet, soulignant sa pertinence pour l'apprentissage automatique.
Comme pour d'autres documents créés par Jon Krohn (tels que le livre Deep Learning Illustrated et sa série vidéo de 18 heures Deep Learning with TensorFlow, Keras et PyTorch) , le contenu de la série prend vie grâce à la combinaison de :
Programmation : toutes les démos de code seront en Python, donc une expérience avec celui-ci ou avec un autre langage de programmation orienté objet serait utile pour suivre les exemples de code. Une bonne (et gratuite !) ressource pour démarrer avec Python est Automate the Boring Stuff d'Al Sweigart.
Mathématiques : La familiarité avec les mathématiques du niveau secondaire facilitera le suivi de la classe. Si vous êtes à l’aise avec des informations quantitatives – comme comprendre des graphiques et réorganiser des équations simples – alors vous devez être bien préparé à suivre toutes les mathématiques. Si vous découvrez que vous avez des lacunes en mathématiques pendant que vous suivez ce programme ML Foundations , je vous recommande la Khan Academy gratuite et complète pour combler ces lacunes.
Voici enfin une illustration d'Oboe, la mascotte de Machine Learning Foundations , créée par la merveilleuse artiste Aglaé Bassens :