Une personne travaillant dans le domaine de l’IA qui ne connaît pas les mathématiques est comme un politicien qui ne sait pas convaincre. Tous deux ont un domaine incontournable sur lequel travailler !
Il y a une semaine, j'ai écrit un article sur Comment se lancer dans la science des données en 2021 et depuis lors, j'ai reçu plusieurs e-mails de personnes du monde entier me demandant combien de mathématiques sont nécessaires en science des données.
Je ne vais pas mentir : c'est beaucoup de mathématiques .
Et c’est une des raisons qui rebute de nombreux débutants. Après de nombreuses recherches et discussions avec plusieurs vétérans du domaine, j'ai compilé ce guide pratique qui couvre tous les principes fondamentaux des mathématiques que vous aurez besoin de connaître . Les concepts mentionnés ci-dessous sont généralement abordés sur plusieurs semestres à l'université, mais je les ai résumés aux principes de base sur lesquels vous pouvez vous concentrer.
Ce guide est une bouée de sauvetage absolue pour les débutants, vous permettant ainsi d'étudier les sujets qui comptent le plus, et une ressource encore meilleure pour les praticiens comme moi qui ont besoin d'un aperçu rapide de ces concepts.
Remarque : Vous n'avez pas besoin de connaître tous les concepts (ci-dessous) pour décrocher votre premier emploi en Data Science. Tout ce dont vous avez besoin est une solide compréhension des principes fondamentaux. Concentrez-vous sur ceux-ci et consolidez-les.
La connaissance de l'algèbre est peut-être fondamentale pour les mathématiques en général. Outre les opérations mathématiques comme l'addition, la soustraction, la multiplication et la division, vous aurez besoin de connaître les éléments suivants :
Exposants
Radicaux
Factorielles
Sommations
Notations scientifiques
L'algèbre linéaire est le principal outil de calcul mathématique en intelligence artificielle et dans de nombreux domaines de la science et de l'ingénierie. En cela, 4 objets mathématiques principaux et leurs propriétés doivent être compris :
Scalaires - un nombre unique (peut être réel ou naturel).
Vecteurs - une liste de nombres, classés dans l'ordre. Considérez-les comme des points dans l'espace, chaque élément représentant la coordonnée le long d'un axe.
Matrices - un tableau 2D de nombres où chaque nombre est identifié par 2 indices.
Tenseurs - un tableau ND de nombres (N>2), disposés sur une grille régulière avec N-axes. Important dans l'apprentissage automatique, l'apprentissage profond et la vision par ordinateur
Vecteurs propres et valeurs propres - vecteurs spéciaux et leur quantité scalaire correspondante. Comprenez leur signification et comment les trouver.
Décomposition en valeurs singulières - factorisation d'une matrice en 3 matrices. Comprendre les propriétés et les applications.
Analyse en composantes principales (ACP) - comprendre la signification, les propriétés et les applications.
Des propriétés telles que le produit Dot, le produit Vector et le produit Hadamard sont également utiles à connaître.
Le calcul traite des changements de paramètres, de fonctions, d'erreurs et d'approximations. Une connaissance pratique du calcul multidimensionnel est impérative en science des données. Voici les concepts les plus importants (bien que non exhaustifs) du calcul :
Dérivées - règles (addition, produit, règle de chaîne, etc.), dérivées hyperboliques (tanh, cosh, etc.) et dérivées partielles.
Calcul vectoriel/matriciel - différents opérateurs dérivés (Gradient, Jacobien, Hessien et Laplacien)
Algorithmes de gradient : maxima et minima locaux/globaux, points de selle, fonctions convexes, lots et mini-lots, descente de gradient stochastique et comparaison des performances.
Statistiques de base - Moyenne, médiane, mode, variance, covariance, etc.
Règles de base en probabilité - événements (dépendants et indépendants), espaces d'échantillonnage, probabilité conditionnelle.
Variables aléatoires - continues et discrètes, espérances, variance, distributions (jointes et conditionnelles).
Théorème de Bayes - calcule la validité des croyances. Les logiciels bayésiens aident les machines à reconnaître des modèles et à prendre des décisions.
Estimation du maximum de vraisemblance (MLE) - estimation des paramètres. Nécessite la connaissance des concepts fondamentaux de probabilité (probabilité conjointe et indépendance des événements).
Distributions communes - binôme, poisson, bernoulli, gaussienne, exponentielle.
Un domaine important qui a apporté d’importantes contributions à l’IA et au Deep Learning, et qui est pourtant méconnu de beaucoup. Cela peut être considéré comme un amalgame de calcul, de statistiques et de probabilités.
Entropie - également appelée Entropie de Shannon. Utilisé pour mesurer l'incertitude d'une expérience.
Cross-Entropy - compare deux distributions de probabilité et nous indique à quel point elles sont similaires.
Kullback Leibler Divergence - une autre mesure de la similitude de deux distributions de probabilité.
Algorithme de Viterbi - largement utilisé dans le traitement du langage naturel (NLP) et la parole
Encodeur-décodeur - utilisé dans les RNN de traduction automatique et d'autres modèles.
En Intelligence Artificielle, les mathématiques sont très importantes. Sans cela, c'est comparable à un corps humain sans âme. Vous pouvez traiter les concepts mathématiques comme un paiement au fur et à mesure : chaque fois qu'un concept étranger apparaît, saisissez-le et dévorez-le ! Le guide ci-dessus présente une ressource minimale, mais complète, pour comprendre tout type de sujet ou de concept en IA.
Bonne chance!
Si vous pensez que cette feuille de route peut être améliorée, veuillez ouvrir un PR avec toutes les mises à jour et soumettre tout problème. Nous continuerons à améliorer cela, vous voudrez peut-être envisager de regarder/mettre en vedette ce référentiel pour le revoir à l'avenir.
Jetez un œil au guide de contribution pour savoir comment mettre à jour la feuille de route.
Ouvrir une pull request avec des améliorations
Discutez des idées dans les problèmes
Faites passer le mot
Contactez-nous pour tout commentaire
Cette feuille de route a été créée par Jason Dsouza et rendue publique sous la licence MIT.