Das Motiv für das Erstellen dieses Repo besteht darin, die Angst vor Mathematik zu spüren und zu tun, was immer Sie in maschinellem Lernen, tiefem Lernen und anderen Bereichen KI tun möchten.
In diesem Repo zeigte ich die Grundlagen von Algebra, Kalkül, Statistik und Wahrscheinlichkeit. Probieren Sie diesen Code in Ihrem Python -Notebook aus, das im EDX -Kurs bereitgestellt wird.
In diesem Repo lernen Sie auch die Bibliotheken, die wesentlich sind wie Numpy, Pandas, Matplotlib ...
Ich werde neues Material hochladen, wenn ich dieses Material nützlich finde. Sie können mir auch helfen, dieses Repo frisch zu halten.
Es gibt viele Gründe, warum die Mathematik des maschinellen Lernens wichtig ist und ich einige von ihnen unten hervorheben werde:
Auswählen des richtigen Algorithmus, der umfasst, dass die Genauigkeit, die Schulungszeit, die Modellkomplexität, die Anzahl der Parameter und die Anzahl der Merkmale Überlegungen geben.
Auswahl der Parametereinstellungen und Validierungsstrategien.
Ermittlung von Unteranpassungen und Überanpassung durch Verständnis des Kompromisses zur Vorspannung.
Schätzung des richtigen Konfidenzintervalls und der richtigen Unsicherheit.
Ein Wissenschaftler, Skyler Speakman, sagte kürzlich, dass "lineare Algebra die Mathematik des 21. Jahrhunderts ist", und ich stimme der Erklärung voll und ganz zu. In ML taucht überall lineare Algebra auf. Topics such as Principal Component Analysis (PCA), Singular Value Decomposition (SVD), Eigendecomposition of a matrix, LU Decomposition, QR Decomposition/Factorization, Symmetric Matrices, Orthogonalization & Orthonormalization, Matrix Operations, Projections, Eigenvalues & Eigenvectors, Vector Spaces and Norms sind für das Verständnis der Optimierungsmethoden erforderlich, die für maschinelles Lernen verwendet werden. Das Erstaunliche an der linearen Algebra ist, dass es so viele Online -Ressourcen gibt. Ich habe immer gesagt, dass das traditionelle Klassenzimmer aufgrund der großen Menge an Ressourcen im Internet stirbt. Mein linearer linearer Algebra -Kurs ist derjenige, der von MIT Courseware (Prof. Gilbert Strang) angeboten wird.
Maschinelles Lernen und Statistiken sind nicht sehr unterschiedliche Felder. Tatsächlich hat kürzlich jemand das maschinelle Lernen als "Statistiken auf einem Mac" definiert. Einige der grundlegenden statistischen und Wahrscheinlichkeitstheorie, die für ML erforderlich sind Erzeugungsfunktionen, maximale Wahrscheinlichkeitsschätzung (MLE), vorher und posterior, maximal eine posteriori -Schätzung (Karte) und Stichprobenmethoden.
Einige der notwendigen Themen umfassen Differential- und Integralkalkül, partielle Derivate, Funktionen der Vektorwerte, Richtungsgradienten, Hessische, Jakobianer, Laplace und Lagrange.
Dies ist wichtig, um die Recheneffizienz und Skalierbarkeit unseres Algorithmus für maschinelles Lernen zu verstehen und die Sparsamkeit in unseren Datensätzen zu nutzen. Kenntnisse über Datenstrukturen (binäre Bäume, Hashing, Haufen, Stapel usw.), dynamische Programmierung, randomisierte und sublineare Algorithmus, Diagramme, Gradienten/stochastische Abfahrten und ursprüngliche methodenmethoden.
Dies umfasst andere mathematische Themen, die in den vier oben beschriebenen Hauptbereichen nicht behandelt werden. Dazu gehören reale und komplexe Analysen (Sätze und Sequenzen, Topologie, metrische Räume, einzelnwertige und kontinuierliche Funktionen, Grenzen, Cauchy-Kernel, Fourier-Transformationen), Informationstheorie (Entropie, Informationsgewinn), Funktionsräume und Verteiler.