Seseorang yang bekerja di bidang AI yang tidak menguasai matematika ibarat politisi yang tidak tahu cara membujuk. Keduanya memiliki bidang yang tidak bisa dihindari untuk dikerjakan!
Seminggu yang lalu, saya menulis artikel tentang Cara Masuk ke Ilmu Data pada tahun 2021 dan sejak itu saya menerima beberapa email dari orang-orang di seluruh dunia yang menanyakan seberapa banyak matematika yang dibutuhkan dalam Ilmu Data.
Saya tidak akan berbohong: Ini banyak matematika .
Dan inilah salah satu alasan yang membuat banyak pemula enggan. Setelah melakukan banyak penelitian dan pembicaraan dengan beberapa veteran di bidangnya, saya telah menyusun panduan sederhana yang mencakup semua dasar-dasar matematika yang perlu Anda ketahui . Konsep-konsep yang disebutkan di bawah ini biasanya dibahas selama beberapa semester di perguruan tinggi, namun saya telah merangkumnya menjadi prinsip-prinsip inti yang dapat Anda fokuskan.
Panduan ini benar-benar merupakan penyelamat bagi para pemula, sehingga Anda dapat mempelajari topik-topik yang paling penting, dan bahkan merupakan sumber daya yang lebih baik lagi bagi para praktisi seperti saya yang membutuhkan pemahaman cepat tentang konsep-konsep ini.
Catatan : Anda tidak perlu mengetahui semua konsep (di bawah) untuk mendapatkan pekerjaan pertama Anda di Ilmu Data. Yang Anda butuhkan hanyalah pemahaman yang kuat tentang dasar-dasarnya. Fokus pada hal-hal tersebut dan konsolidasikan.
Pengetahuan tentang aljabar mungkin merupakan dasar matematika secara umum. Selain operasi matematika seperti penjumlahan, pengurangan, perkalian, dan pembagian, Anda juga perlu mengetahui hal-hal berikut:
Eksponen
Radikal
Faktorial
Penjumlahan
Notasi Ilmiah
Aljabar Linier adalah alat komputasi matematika utama dalam Kecerdasan Buatan dan banyak bidang Sains dan Teknik. Dalam hal ini, 4 objek matematika utama dan propertinya perlu dipahami:
Skalar - bilangan tunggal (bisa real atau natural).
Vektor - daftar angka, disusun secara berurutan. Anggaplah mereka sebagai titik-titik dalam ruang dengan setiap elemen mewakili koordinat sepanjang sumbu.
Matriks - susunan angka 2-D yang setiap angkanya diidentifikasi oleh 2 indeks.
Tensor - larik angka ND (N>2), disusun pada kisi biasa dengan sumbu N. Penting dalam Pembelajaran Mesin, Pembelajaran Mendalam, dan Visi Komputer
Vektor Eigen & Nilai Eigen - vektor khusus dan besaran skalar yang sesuai. Pahami pentingnya dan cara menemukannya.
Dekomposisi Nilai Singular - faktorisasi suatu matriks menjadi 3 matriks. Memahami properti dan aplikasi.
Analisis Komponen Utama (PCA) - memahami signifikansi, properti, dan aplikasinya.
Properti seperti perkalian titik, perkalian vektor, dan perkalian Hadamard juga berguna untuk diketahui.
Kalkulus berkaitan dengan perubahan parameter, fungsi, kesalahan dan perkiraan. Pengetahuan tentang kalkulus multidimensi sangat penting dalam Ilmu Data. Berikut ini adalah konsep yang paling penting (walaupun tidak lengkap) dalam Kalkulus:
Derivatif - aturan (penjumlahan, perkalian, aturan rantai, dll), turunan hiperbolik (tanh, cosh, dll) dan turunan parsial.
Kalkulus Vektor/Matriks - operator turunan yang berbeda (Gradien, Jacobian, Hessian, dan Laplacian)
Algoritma Gradien - maxima & minima lokal/global, titik pelana, fungsi cembung, batch & mini-batch, penurunan gradien stokastik, dan perbandingan kinerja.
Statistik Dasar - Mean, median, mode, varians, kovarians, dll
Aturan dasar dalam probabilitas - peristiwa (bergantung & independen), ruang sampel, probabilitas bersyarat.
Variabel acak - kontinu & diskrit, ekspektasi, varians, distribusi (bersama & bersyarat).
Teorema Bayes - menghitung validitas keyakinan. Perangkat lunak Bayesian membantu mesin mengenali pola dan mengambil keputusan.
Estimasi Kemungkinan Maksimum (MLE) - estimasi parameter. Membutuhkan pengetahuan tentang konsep probabilitas mendasar (probabilitas gabungan dan independensi peristiwa).
Distribusi Umum - binomial, poisson, bernoulli, gaussian, eksponensial.
Bidang penting yang telah memberikan kontribusi signifikan terhadap AI dan Pembelajaran Mendalam, namun belum diketahui banyak orang. Hal ini dapat dianggap sebagai penggabungan kalkulus, statistik dan probabilitas.
Entropi - juga disebut Entropi Shannon. Digunakan untuk mengukur ketidakpastian dalam suatu percobaan.
Cross-Entropy - membandingkan dua distribusi probabilitas & memberi tahu kita seberapa miripnya keduanya.
Divergensi Kullback Leibler - ukuran lain tentang seberapa mirip dua distribusi probabilitas.
Algoritma Viterbi - banyak digunakan dalam Natural Language Processing (NLP) & Speech
Encoder-Decoder - digunakan dalam RNN Terjemahan Mesin & model lainnya.
Dalam Kecerdasan Buatan, matematika sangatlah penting. Tanpanya, ibarat tubuh manusia tanpa jiwa. Anda dapat memperlakukan konsep matematika sebagai sesuatu yang harus dibayar sesuai pemakaian: setiap kali konsep asing muncul, ambil dan telanlah! Panduan di atas menyajikan sumber daya yang minimal namun komprehensif untuk memahami segala jenis topik atau konsep di AI.
Semoga beruntung!
Jika menurut Anda peta jalan ini dapat diperbaiki, silakan buka PR dengan pembaruan apa pun dan kirimkan masalah apa pun. Kami akan terus menyempurnakannya, jadi Anda mungkin ingin mempertimbangkan untuk menonton/membintangi repositori ini untuk mengunjunginya kembali di masa mendatang.
Lihat panduan kontribusi untuk mengetahui cara memperbarui peta jalan.
Buka permintaan tarik dengan perbaikan
Diskusikan ide-ide dalam masalah
Sebarkan beritanya
Hubungi jika ada masukan
Peta jalan ini dibuat oleh Jason Dsouza dan tersedia untuk umum di bawah Lisensi MIT.