Le motif derrière la création de ce dépôt est de ressentir la peur des mathématiques et de faire ce que vous voulez faire dans l'apprentissage automatique, l'apprentissage en profondeur et d'autres domaines de l'IA.
Dans ce repo, j'ai démontré des bases de l'algèbre, du calcul, des statistiques et de la probabilité. Alors, essayez ce code dans votre ordinateur portable Python qui est fourni dans le cours EDX.
Dans ce dépôt, vous apprendrez également les bibliothèques qui sont essentielles comme Numpy, Pandas, Matplotlib ...
Je vais télécharger de nouveaux matériaux lorsque je trouve que ces matériaux utiles, vous pouvez également m'aider à garder ce repo frais.
Il existe de nombreuses raisons pour lesquelles les mathématiques de l'apprentissage automatique sont importantes et je mettrai en évidence certaines d'entre elles ci-dessous:
Sélection de l'algorithme droit qui comprend des considérations à la précision, au temps de formation, à la complexité du modèle, au nombre de paramètres et au nombre de fonctionnalités.
Choisir les paramètres et les stratégies de validation.
Identifier les sous-ajustements et le sur-ajustement en comprenant le compromis de la vany-variance.
Estimation du bon intervalle de confiance et de l'incertitude.
Un scientifique, Skyler Speakman, a récemment déclaré que «l'algèbre linéaire est les mathématiques du 21e siècle» et je suis totalement d'accord avec la déclaration. En ML, l'algèbre linéaire apparaît partout. Des sujets tels que l'analyse des composants principaux (PCA), la décomposition de la valeur singulière (SVD), la composition eigende sont nécessaires pour comprendre les méthodes d'optimisation utilisées pour la machine apprentissage. Ce qui est étonnant à propos de l'algèbre linéaire, c'est qu'il y a tellement de ressources en ligne. J'ai toujours dit que la classe traditionnelle est en train de mourir en raison de la grande quantité de ressources disponibles sur Internet. Mon cours d'algèbre linéaire préféré est celui proposé par le MIT UST (Prof. Gilbert Strang).
L'apprentissage automatique et les statistiques ne sont pas des domaines très différents. En fait, quelqu'un a récemment défini l'apprentissage automatique comme «faire des statistiques sur un Mac». Une partie de la théorie statistique et de la probabilité fondamentale nécessaire pour la ML est la combinatoire, les règles de probabilité et les axiomes, le théorème de Bayes, les variables aléatoires, la variance et l'attente, les distributions conditionnelles et conjointes, les distributions standard (Bernoulli, binomial, multinomial, uniforme et gaussien), moment Fonctions de génération, estimation du maximum de vraisemblance (MLE), antérieure et postérieure, maximum a postérieur Estimation (carte) et méthodes d'échantillonnage.
Certains des sujets nécessaires incluent le calcul différentiel et intégral, les dérivés partiels, les fonctions de valeurs vectorielles, le gradient directionnel, la distribution de Hesse, de jacobien, de laplacien et de lagrangien.
Ceci est important pour comprendre l'efficacité de calcul et l'évolutivité de notre algorithme d'apprentissage automatique et pour l'exploitation de la rareté dans nos ensembles de données. La connaissance des structures de données (arbres binaires, hachage, tas, pile, etc.), la programmation dynamique, l'algorithme randomisé et sous-linéaire, les graphiques, les descentes gradient / stochastiques et les méthodes dual primal sont nécessaires.
Cela comprend d'autres sujets mathématiques non couverts dans les quatre principaux domaines décrits ci-dessus. Ils incluent une analyse réelle et complexe (ensembles et séquences, topologie, espaces métriques, fonctions à valeur unique et continue, limites, noyau Cauchy, transformations de Fourier), théorie de l'information (entropie, gain d'information), espaces de fonction et collecteurs.