? Ranked as one of the top data science repositories on GitHub!
Teknik, alat, praktik terbaik, dan semua yang Anda perlukan untuk mempelajari pembelajaran mesin!
Paket Pembelajaran Mesin Lengkap adalah gudang komprehensif yang berisi 35 buku catatan tentang pemrograman Python, manipulasi data, analisis data, visualisasi data, pembersihan data, pembelajaran mesin klasik, Computer Vision, dan Natural Language Processing (NLP).
Semua buku catatan dibuat dengan mempertimbangkan pembaca. Setiap buku catatan dimulai dengan ikhtisar tingkat tinggi tentang algoritma/konsep tertentu yang dibahas. Jika memungkinkan, visual digunakan untuk memperjelas.
10 Mei 2023: Menambahkan panduan komprehensif tentang MLOps. Nikmati panduannya!!
23 Juni 2022: Banyak orang bertanya bagaimana mereka dapat mendukung paket tersebut. Anda dapat membelikan kami kopi ☕️
18 Mei 2022: Paket Pembelajaran Mesin Lengkap kini tersedia di web. Sekarang mudah untuk melihat semua buku catatan!
9 April 2022: Pembelajaran Transfer yang Diperbarui dengan Jaringan Neural Konvolusional Terlatih dengan hal-hal tambahan dan sumber daya tambahan.
25 November 2021: Dasar-dasar Pembelajaran Mesin yang Diperbarui: Menambahkan catatan pengantar, alur kerja desain sistem ML, dan tantangan sistem pembelajaran.
Berikut adalah alat-alat yang tercakup dalam Paket Pembelajaran Mesin Lengkap. Mereka adalah alat populer yang dibutuhkan oleh sebagian besar teknisi pembelajaran mesin dan ilmuwan data dalam satu atau lain cara dan sehari-hari.
Python adalah bahasa pemrograman tingkat tinggi yang mendapatkan banyak popularitas di komunitas data dan dengan pesatnya pertumbuhan perpustakaan dan kerangka kerja, ini adalah bahasa pemrograman yang tepat untuk melakukan ML.
NumPy adalah alat komputasi ilmiah yang digunakan untuk operasi array atau matriks.
Pandas adalah alat yang hebat dan sederhana untuk menganalisis dan memanipulasi data dari berbagai sumber berbeda.
Matplotlib adalah alat visualisasi data komprehensif yang digunakan untuk membuat visualisasi statis, animasi, dan interaktif dengan Python.
Seaborn adalah alat visualisasi data lain yang dibangun di atas Matplotlib dan cukup mudah digunakan.
Scikit-Learn: Daripada membuat model pembelajaran mesin dari awal, Scikit-Learn memudahkan penggunaan model klasik dalam beberapa baris kode. Alat ini diadaptasi oleh hampir seluruh komunitas dan industri ML, mulai dari perusahaan rintisan hingga perusahaan teknologi besar.
TensorFlow dan Keras untuk deep learning: TensorFlow adalah framework deep learning populer yang digunakan untuk membuat model yang cocok untuk berbagai bidang seperti Computer Vision dan Natural Language Processing. Keras adalah API jaringan saraf tingkat tinggi yang memudahkan perancangan model pembelajaran mendalam. TensorFlow dan Keras memiliki komunitas dan ekosistem hebat yang mencakup alat seperti TensorBoard, TF Datasets, TensorFlow Lite, TensorFlow Extended, TensorFlow Hub, TensorFlow.js, TensorFlow GNN, dan banyak lagi.
[ Anda dapat menemukan catatan mendetail tentang NumPy di sini ]
Analisis Data Eksplorasi
Pengantar Persiapan Data
Menangani Fitur Kategorikal
Penskalaan Fitur
Menangani Nilai yang Hilang
Pengantar Scikit-Learn untuk Pembelajaran Mesin
Model Linier untuk Regresi
Model Linier untuk Klasifikasi
Mesin Vektor Dukungan: Intro dan Regresi
Mendukung Mesin Vektor untuk Klasifikasi
Pohon Keputusan: Intro dan Regresi
Pohon Keputusan untuk Klasifikasi
Hutan Acak: Intro dan Regresi
Hutan Acak untuk Klasifikasi
Beyond Random Forests: Lebih Banyak Model Ensemble
Pengantar Pembelajaran Tanpa Pengawasan dengan KMeans Clustering
Pengantar Praktis Analisis Komponen Utama
Pengantar Jaringan Syaraf Tiruan
Mengapa Pembelajaran Mendalam
Jaringan Neural Lapisan Tunggal
Fungsi Aktivasi
Jenis Arsitektur Pembelajaran Mendalam
Tantangan dalam Melatih Jaringan Syaraf Dalam
Pengantar TensorFlow untuk Pembelajaran Mendalam
Jaringan Neural untuk Regresi dengan TensorFlow
Jaringan Neural untuk Klasifikasi dengan TensorFlow
Pengantar Computer Vision dengan Convolutional Neural Networks (CNN)
ConvNets untuk Data Dunia Nyata dan Augmentasi Gambar
Mentransfer Pembelajaran dengan Jaringan Neural Konvolusional Terlatih
[Buku catatan Pembelajaran Transfer yang diperbarui dapat ditemukan di sini]
Pengantar NLP dan Pemrosesan Teks dengan TensorFlow
Menggunakan Penyematan Kata untuk Mewakili Teks
Jaringan Neural Berulang (RNN)
Menggunakan Jaringan Neural Konvolusional untuk Klasifikasi Teks
Menggunakan BERT Terlatih untuk Klasifikasi Teks
Banyak kumpulan data yang digunakan untuk repositori ini berasal dari sumber berikut:
Komunitas Machine Learning sangat dinamis. Paket Pembelajaran Mesin Lengkap dapat membantu Anda memulai, namun itu tidak cukup. Untungnya, ada banyak sumber belajar yang luar biasa, beberapa di antaranya berbayar atau tersedia secara gratis. Berikut daftar kursus yang sering direkomendasikan banyak orang. Perhatikan bahwa mereka tidak terdaftar dalam urutan pengambilannya.
Pembelajaran Mesin oleh Coursera : Kursus ini diajarkan oleh Andrew Ng. Ini adalah salah satu kursus pembelajaran mesin paling populer dan telah diikuti oleh lebih dari 4 juta orang. Kursus ini lebih berfokus pada dasar-dasar teknik dan algoritma pembelajaran mesin. Ini gratis di Coursera.
Spesialisasi Pembelajaran Mendalam : Juga dikemukakan oleh Andrew Ng., Spesialisasi Pembelajaran Mendalam juga merupakan kursus berbasis dasar. Ini mengajarkan dasar-dasar yang layak untuk arsitektur pembelajaran mendalam utama seperti jaringan saraf konvolusional dan jaringan saraf berulang. Kursus selengkapnya dapat diaudit di Coursera, atau ditonton secara gratis di Youtube.
Pengantar Pembelajaran Mendalam MIT : Kursus ini memberikan dasar-dasar pembelajaran mendalam dalam waktu yang sangat singkat. Setiap perkuliahan berdurasi satu jam atau kurang, namun materinya tetap yang terbaik di kelas. Periksa halaman kursus di sini, dan video ceramah di sini.
Pengantar MIT tentang AI Data-Centric : Ini adalah kursus pertama tentang DCAI. Kelas ini mencakup algoritme untuk menemukan dan memperbaiki masalah umum dalam data ML dan untuk membuat kumpulan data yang lebih baik, dengan berkonsentrasi pada data yang digunakan dalam tugas pembelajaran yang diawasi seperti klasifikasi. Semua materi yang diajarkan dalam kursus ini sangat praktis, berfokus pada aspek penerapan ML di dunia nyata, bukan detail matematis tentang cara kerja model tertentu. Anda dapat mengikuti kursus ini untuk mempelajari teknik praktis yang tidak dibahas di sebagian besar kelas ML, yang akan membantu mengurangi masalah “sampah masuk, sampah keluar” yang mengganggu banyak aplikasi ML di dunia nyata. Lihat halaman kursus di sini, video ceramah di sini, dan tugas lab di sini.
NYU Deep Learning Spring 2021 : Diajarkan di NYU oleh Yann LeCun, Alfredo Canziani, kursus ini adalah salah satu kursus paling kreatif di luar sana. Materi disajikan dengan luar biasa. Periksa video ceramah di sini, dan repo kursus di sini.
CS231N: Jaringan Neural Konvolusional untuk Pengenalan Visual oleh Stanford : CS231N adalah salah satu kursus pembelajaran mendalam dan visi komputer terbaik. Versi 2017 diajarkan oleh Fei-Fei Li, Justin Johnson dan Serena Yeung. Versi 2016 diajarkan oleh Fei-Fei, Johnson dan Andrej Karpathy. Lihat video ceramah tahun 2017 di sini, dan materi lainnya di sini.
CS224N: Pemrosesan Bahasa Alami dengan Pembelajaran Mendalam oleh Stanford : Jika Anda tertarik dengan Pemrosesan Bahasa Alami, ini adalah kursus yang bagus untuk diambil. Hal ini diajarkan oleh Christopher Manning, salah satu bintang NLP kelas dunia. Lihat video ceramahnya di sini.
Pembelajaran Mendalam Praktis untuk Pembuat Kode oleh fast.ai : Ini juga merupakan kursus pembelajaran mendalam intensif yang mencakup seluruh spektrum arsitektur dan teknik pembelajaran mendalam. Video ceramah dan sumber lain seperti buku catatan adalah halaman kursus.
Spesialisasi Rekayasa Pembelajaran Mesin untuk Produksi (MLOps) : Diajarkan oleh Andrew Ng., Laurence Moroney, dan Robert Crowe, ini adalah salah satu kursus teknik ML terbaik. Ini mengajarkan cara merancang sistem produksi pembelajaran mesin ujung ke ujung, membangun data yang efisien dan jalur pemodelan, dan menerapkan model dalam produksi. Anda dapat menemukan kursus di Coursera dan materi kursus lainnya di Github.
Pembelajaran Mendalam Full Stack : Meskipun sebagian besar kursus pembelajaran mesin berfokus pada pemodelan, kursus ini berfokus pada sistem pembelajaran mesin pengiriman. Ini mengajarkan cara merancang proyek pembelajaran mesin, manajemen data (penyimpanan, akses, pemrosesan, pembuatan versi, dan pelabelan), pelatihan, debugging, dan penerapan model pembelajaran mesin. Lihat versi 2021 di sini dan 2019 di sini. Anda juga dapat melihat sekilas tampilan proyek untuk melihat jenis hasil kursus melalui proyek pembelajar.
Di bawah ini adalah beberapa buku pembelajaran mesin yang mengagumkan.
Buku Pembelajaran Mesin Seratus Halaman : Ditulis oleh Andriy Burkov, ini adalah salah satu buku terpendek namun ringkas dan ditulis dengan baik yang pernah Anda temukan di internet. Anda dapat membaca bukunya secara gratis di sini.
Rekayasa Pembelajaran Mesin : Juga ditulis oleh Andriy Burkov, ini adalah buku pembelajaran mesin hebat lainnya yang mengungkap setiap langkah alur kerja pembelajaran mesin, mulai dari pengumpulan data, persiapan....hingga penyajian dan pemeliharaan model. Bukunya juga gratis di sini.
Kerinduan Pembelajaran Mesin : Ditulis oleh Andrew Ng., buku ini berisi berbagai strategi untuk membangun sistem pembelajaran yang efektif. Itu dipartisi menjadi bagian-bagian kecil yang membuatnya mudah dibaca dan tidak terlalu diperuntukkan bagi para insinyur pembelajaran mesin. Siapa pun yang bekerja dengan tim ilmu data dan pembelajaran mesin dapat merasakan manfaat buku ini. Buku resminya tersedia di sini secara gratis, tetapi Anda dapat membaca atau mendownloadnya di sini tanpa perlu mendaftar.
Pembelajaran Mesin Praktis dengan Scikit-Learn, Keras, dan TensorFlow : Ditulis oleh Aurelion Geron, ini adalah salah satu buku pembelajaran mesin terbaik. Ini ditulis dengan jelas dan penuh dengan ide dan praktik terbaik. Anda bisa mendapatkan bukunya di sini, atau melihat repositorinya di sini.
Pembelajaran Mendalam : Ditulis oleh 3 legenda pembelajaran mendalam, Ian Goodfellow dan Yoshua Bengio dan Aaron Courville, ini adalah salah satu buku pembelajaran mendalam yang tersedia secara gratis. Anda bisa mendapatkannya di sini.
Pembelajaran Mendalam dengan Python : Ditulis oleh Francois Chollet, desainer Keras, ini adalah buku pembelajaran mendalam yang sangat komprehensif. Anda bisa mendapatkan bukunya di sini, dan repo bukunya di sini.
Selami Pembelajaran Mendalam : Ini juga merupakan buku pembelajaran mendalam yang bagus dan tersedia secara gratis. Buku ini menggunakan PyTorch dan TensorFlow. Anda dapat membaca seluruh buku di sini.
Jaringan Neural dan Pembelajaran Mendalam : Ini juga merupakan buku online pembelajaran mendalam hebat lainnya yang ditulis oleh Michael Nielsen. Anda dapat membaca seluruh buku di sini.
Jika Anda tertarik dengan sumber daya pembelajaran mesin dan pembelajaran mendalam lainnya, Anda dapat menemukannya di sini, di sini, dan di sini
@article{Nyandwi2021MLPackage,
title = "Complete Machine Learning Package",
author = "Nyandwi, Jean de Dieu",
journal = "GitHub",
year = "2021",
url = "https://nyandwi.com/machine_learning_complete",
}
Repositori ini dibuat oleh Jean de Dieu Nyandwi. Anda dapat menemukannya di Twitter, LinkedIn, Medium, dan Instagram.