Motif di balik menciptakan repo ini adalah merasakan ketakutan matematika dan melakukan apa pun yang ingin Anda lakukan dalam pembelajaran mesin, pembelajaran mendalam dan bidang AI lainnya.
Dalam repo ini saya menunjukkan dasar -dasar aljabar, kalkulus, statistik dan probabilitas. Jadi, coba kode ini di notebook Python Anda yang disediakan dalam kursus EDX.
Dalam repo ini Anda juga akan mempelajari perpustakaan yang penting seperti numpy, panda, matplotlib ...
Saya akan mengunggah materi baru ketika saya menemukan materi itu berguna, Anda juga dapat membantu saya menjaga repo ini tetap segar.
Ada banyak alasan mengapa matematika pembelajaran mesin itu penting dan saya akan menyoroti beberapa di antaranya:
Memilih algoritma yang tepat yang mencakup pertimbangan untuk akurasi, waktu pelatihan, kompleksitas model, jumlah parameter dan jumlah fitur.
Memilih pengaturan parameter dan strategi validasi.
Mengidentifikasi underfitting dan overfitting dengan memahami tradeoff bias-varians.
Memperkirakan interval kepercayaan dan ketidakpastian yang tepat.
Seorang ilmuwan, Skyler Speakman, baru -baru ini mengatakan bahwa "aljabar linier adalah matematika abad ke -21" dan saya sepenuhnya setuju dengan pernyataan itu. Dalam ML, aljabar linier muncul di mana -mana. Topics such as Principal Component Analysis (PCA), Singular Value Decomposition (SVD), Eigendecomposition of a matrix, LU Decomposition, QR Decomposition/Factorization, Symmetric Matrices, Orthogonalization & Orthonormalization, Matrix Operations, Projections, Eigenvalues & Eigenvectors, Vector Spaces and Norms diperlukan untuk memahami metode optimasi yang digunakan untuk pembelajaran mesin. Hal yang luar biasa tentang aljabar linier adalah bahwa ada begitu banyak sumber daya online. Saya selalu mengatakan bahwa ruang kelas tradisional sedang sekarat karena banyaknya sumber daya yang tersedia di internet. Kursus aljabar linier favorit saya adalah yang ditawarkan oleh MIT Courseware (Prof. Gilbert Strang).
Pembelajaran dan statistik mesin tidak terlalu berbeda. Sebenarnya, seseorang baru -baru ini mendefinisikan pembelajaran mesin sebagai 'melakukan statistik pada Mac'. Some of the fundamental Statistical and Probability Theory needed for ML are Combinatorics, Probability Rules & Axioms, Bayes' Theorem, Random Variables, Variance and Expectation, Conditional and Joint Distributions, Standard Distributions (Bernoulli, Binomial, Multinomial, Uniform and Gaussian), Moment Fungsi menghasilkan, estimasi kemungkinan maksimum (MLE), sebelum dan posterior, maksimum A posteriori Estimasi (MAP) dan metode pengambilan sampel.
Beberapa topik yang diperlukan termasuk kalkulus diferensial dan integral, turunan parsial, fungsi vektor-nilai, gradien terarah, distribusi Hessian, Jacobian, Laplacian dan Lagrangian.
Ini penting untuk memahami efisiensi komputasi dan skalabilitas algoritma pembelajaran mesin kami dan untuk mengeksploitasi sparsity dalam set data kami. Pengetahuan tentang struktur data (pohon biner, hashing, tumpukan, tumpukan dll), pemrograman dinamis, algoritma acak & sublinear, grafik, keturunan gradien/stokastik dan metode primal-ganda diperlukan.
Ini terdiri dari topik matematika lain yang tidak tercakup dalam empat bidang utama yang dijelaskan di atas. Mereka termasuk analisis nyata dan kompleks (set dan urutan, topologi, ruang metrik, fungsi bernilai tunggal dan kontinu, batas, kernel cauchy, transformasi Fourier), teori informasi (entropi, perolehan informasi), ruang fungsi dan manifold.