pip install numpy
)pip install pandas
)pip install scikit-learn
)pip install scipy
)pip install statsmodels
)pip install matplotlib
)pip install seaborn
)pip install sympy
)pip install flask
)pip install wtforms
)pip install tensorflow>=1.15
)pip install keras
)pip install pdpipe
)Anda bisa memulai dengan artikel yang saya tulis di majalah Heartbeat (di platform Medium):
Notebook Jupyter mencakup berbagai fungsi dan operasi pada topik NumPy, Pandans, Seaborn, Matplotlib, dll.
Berbagai cara untuk melakukan regresi linier dengan Python dan perbandingan kecepatannya (lihat artikel yang saya tulis di freeCodeCamp)
Regresi multivariat dengan regularisasi
Regresi polinomial menggunakan fitur pipeline scikit-learn (lihat artikel yang saya tulis di Towards Data Science )
Pohon keputusan dan regresi Random Forest (menunjukkan bagaimana Random Forest bekerja sebagai meta-estimator yang kuat/teratur yang menolak overfitting)
Analisis visual terperinci dan uji diagnostik kesesuaian untuk masalah regresi linier
Regresi linier yang kuat menggunakan HuberRegressor
dari Scikit-learn
k -klasifikasi tetangga terdekat (Ini Notebooknya)
Pohon Keputusan dan Klasifikasi Hutan Acak (Ini Buku Catatannya)
Mendukung klasifikasi mesin vektor (Ini Notebooknya) ( lihat artikel yang saya tulis di Menuju Ilmu Data pada SVM dan algoritma pengurutan)
K -means clustering (Ini Notebooknya)
Propagasi afinitas (menunjukkan kompleksitas waktu dan pengaruh faktor redaman) (Ini Notebooknya)
Teknik mean-shift (menunjukkan kompleksitas waktu dan pengaruh noise pada penemuan cluster) (Ini Notebooknya)
DBSCAN (menunjukkan bagaimana secara umum dapat mendeteksi area dengan kepadatan tinggi terlepas dari bentuk cluster, yang gagal dilakukan oleh k-means) (Ini Notebooknya)
Pengelompokan hierarki dengan Dendogram menunjukkan cara memilih jumlah cluster yang optimal (Ini Notebooknya)
Cara menggunakan paket Sympy untuk menghasilkan kumpulan data acak menggunakan ekspresi matematika simbolik.
Berikut artikel saya di Medium tentang topik ini: Regresi acak dan pembuatan masalah klasifikasi dengan ekspresi simbolik
Melayani model regresi linier melalui antarmuka server HTTP sederhana. Pengguna perlu meminta prediksi dengan menjalankan skrip Python. Menggunakan Flask
dan Gunicorn
.
Melayani jaringan saraf berulang (RNN) melalui halaman web HTTP, lengkap dengan formulir web, tempat pengguna dapat memasukkan parameter dan mengklik tombol untuk menghasilkan teks berdasarkan model RNN yang telah dilatih sebelumnya. Menggunakan Flask
, Jinja
, Keras
/ TensorFlow
, WTForms
.
Menerapkan beberapa prinsip inti OOP dalam konteks pembelajaran mesin dengan membuat estimator mirip Scikit-learn Anda sendiri, dan menjadikannya lebih baik.
Lihat artikel saya di Medium tentang topik ini.
Periksa file dan instruksi terperinci di direktori Pytest untuk memahami bagaimana seseorang harus menulis kode/modul pengujian unit untuk model pembelajaran mesin
Membuat profil kode ilmu data dan model ML untuk jejak memori dan waktu komputasi adalah area yang penting namun sering kali diabaikan. Berikut adalah beberapa Buku Catatan yang menunjukkan idenya,