Repo ini berisi kode yang menyertai kurikulum Machine Learning Foundations milik Jon Krohn, yang memberikan gambaran komprehensif tentang semua mata pelajaran — di bidang matematika, statistik, dan ilmu komputer — yang mendasari pendekatan pembelajaran mesin kontemporer, termasuk pembelajaran mendalam dan kecerdasan buatan lainnya. teknik.
Ada delapan mata pelajaran dalam kurikulum, yang disusun menjadi empat mata pelajaran. Lihat bagian "Rumah Pembelajaran Mesin" di bawah untuk mengetahui detail mengapa hal ini merupakan bidang studi dasar yang penting:
Mata pelajaran selanjutnya dibangun berdasarkan isi mata pelajaran sebelumnya, jadi pendekatan yang disarankan adalah melanjutkan delapan mata pelajaran sesuai urutan yang disediakan. Oleh karena itu, Anda dipersilakan untuk memilih subjek individual berdasarkan minat atau pemahaman Anda terhadap materi tersebut. Secara khusus, masing-masing dari empat bidang studi cukup independen sehingga dapat didekati secara terpisah.
Delapan mata pelajaran ML Foundations awalnya ditawarkan oleh Jon Krohn sebagai pelatihan online langsung di platform pembelajaran O'Reilly mulai Mei-Sep 2020 (dan ditawarkan untuk kedua kalinya mulai Juli-Des 2021; lihat di sini untuk tanggal kuliah individu).
Untuk menyesuaikan mode pembelajaran pilihan Anda, konten kini tersedia melalui beberapa saluran:
(Perhatikan bahwa meskipun YouTube berisi 100% konten yang diajarkan, opsi berbayar — misalnya, Udemy, O'Reilly, dan ODSC — berisi panduan solusi komprehensif untuk latihan yang tidak tersedia di YouTube. Beberapa opsi berbayar juga mencakup fitur eksklusif dan spesifik platform seperti pengujian interaktif, "lembar contekan" dan pemberian sertifikat untuk penyelesaian kursus yang berhasil.)
Untuk tetap mendapat informasi tentang sesi pelatihan langsung di masa depan, rilis video baru, dan rilis bab buku, pertimbangkan untuk mendaftar buletin email Jon Krohn melalui berandanya.
Semua kode disediakan dalam notebook Jupyter di direktori ini. Notebook ini dimaksudkan untuk digunakan dalam lingkungan cloud Colab (gratis) dan merupakan satu-satunya lingkungan yang saat ini didukung secara aktif.
Oleh karena itu, jika Anda terbiasa menjalankan notebook Jupyter secara lokal, Anda dapat melakukannya (perhatikan bahwa versi pustaka dalam Dockerfile repo ini belum tentu terkini, namun dapat memberikan titik awal yang masuk akal untuk menjalankan Jupyter dalam container Docker) .
Untuk menjadi ilmuwan data atau insinyur ML yang luar biasa, tidak cukup hanya mengetahui cara menggunakan algoritme ML melalui antarmuka abstrak yang disediakan oleh perpustakaan paling populer (misalnya, scikit-learn, Keras). Untuk melatih model inovatif atau menerapkannya agar dapat berjalan dengan baik dalam produksi, apresiasi mendalam terhadap teori pembelajaran mesin (digambarkan sebagai pusat, lantai ungu dari "Rumah Pembelajaran Mesin") mungkin berguna atau penting. Dan, untuk menumbuhkan apresiasi yang mendalam terhadap ML, seseorang harus memiliki pemahaman yang baik tentang mata pelajaran dasar.
Jika fondasi "Rumah Pembelajaran Mesin" sudah kokoh, peralihan dari prinsip ML umum (lantai ungu) ke domain ML khusus (lantai atas, ditampilkan dalam warna abu-abu) seperti pembelajaran mendalam, natural pemrosesan bahasa, visi mesin, dan pembelajaran penguatan. Hal ini karena, semakin terspesialisasi penerapannya, semakin besar kemungkinan rincian penerapannya hanya tersedia dalam makalah akademis atau buku teks tingkat pascasarjana, yang keduanya biasanya mengasumsikan pemahaman tentang mata pelajaran dasar.
Konten dalam seri ini mungkin relevan bagi Anda jika:
Subyek dasar sebagian besar tidak berubah dalam beberapa dekade terakhir dan kemungkinan akan tetap demikian selama beberapa dekade mendatang, namun topik ini sangat penting dalam semua pendekatan pembelajaran mesin dan ilmu data. Oleh karena itu, yayasan memberikan landasan yang kokoh dan berjangka panjang dalam karier.
Tujuan dari seri ini adalah untuk memberi Anda pemahaman praktis dan fungsional tentang konten yang dibahas. Konteks akan diberikan untuk setiap topik, menyoroti relevansinya dengan pembelajaran mesin.
Seperti materi lain yang dibuat oleh Jon Krohn (seperti buku Deep Learning Illustrated dan serial video berdurasi 18 jam miliknya Deep Learning with TensorFlow, Keras, dan PyTorch) , konten dalam serial ini dihidupkan melalui kombinasi:
Pemrograman : Semua demo kode akan menggunakan Python sehingga pengalaman dengannya atau bahasa pemrograman berorientasi objek lainnya akan berguna untuk mengikuti contoh kode. Sumber daya yang bagus (dan gratis!) untuk memulai dengan Python adalah Automate the Boring Stuff dari Al Sweigart.
Matematika : Keakraban dengan matematika tingkat sekolah menengah akan membuat kelas lebih mudah diikuti. Jika Anda merasa nyaman menangani informasi kuantitatif – seperti memahami grafik dan menyusun ulang persamaan sederhana – maka Anda harus bersiap dengan baik untuk mengikuti semua matematika. Jika Anda menemukan beberapa kesenjangan matematika saat mempelajari kurikulum ML Foundations ini, saya merekomendasikan Khan Academy yang gratis dan komprehensif untuk mengisi kesenjangan tersebut.
Terakhir, inilah ilustrasi Oboe, maskot Machine Learning Foundations , yang dibuat oleh seniman hebat Aglaé Bassens: