menjelaskan
Ringkasan Pengetahuan Dasar tentang Pembelajaran Mesin, Pembelajaran Mendalam, dan Pemrosesan Bahasa Alami.
Saat ini, ini terutama mengacu pada buku guru Li Hang "Metode Pembelajaran Statistik", dan beberapa konten seperti XGBoost , pengelompokan , konten terkait pembelajaran yang mendalam , konten terkait NLP , dll. Tidak disebutkan dalam buku ini.
Karena parser penurunan harga GitHub tidak mendukung lateks, catatan perlu digunakan secara lokal untuk menelusuri secara normal, dan Anda juga dapat secara langsung mengakses tautan blog yang diberikan di bawah ini.
Folder dokumen adalah catatan, folder kode adalah kode, folder data adalah set data yang digunakan oleh kode tertentu, dan folder gambar adalah gambar yang digunakan di bagian Catatan.
Karena waktu dan energi yang terbatas, beberapa kode berasal dari proyek open source GitHub, seperti SEQ2SEQ, transformator dan bagian lain dari kode, dan beberapa kode bab harus dilengkapi.
Pembelajaran Mesin
- Regresi linier (catatan)
- Mesin Persepsi (Catatan + Kode)
- Knn (Catatan + Kode)
- Naive Bayes (catatan + kode)
- Pohon Keputusan (Catatan + Kode)
- Regresi logistik (catatan + kode)
- Entropi maksimum (catatan + kode)
- SVM (Catatan + Kode)
- Adaboost (catatan + kode)
- GBDT (Catatan + Kode)
- Algoritma EM (Catatan + Kode)
- Model Markov Tersembunyi (Catatan + Kode)
- Bidang acak bersyarat (catatan)
- Hutan acak (catatan + kode)
- XGBoost (catatan)
- Clustering (catatan)
- Pemilihan Fitur Teknik Fitur (Catatan)
- Algoritma reduksi dimensi untuk rekayasa fitur (catatan)
Pembelajaran yang mendalam
- Jaringan Saraf (Catatan + Kode)
- RNN (catatan)
- LSTM dan Gru (catatan)
- CNN (catatan)
- Metode optimasi dalam pembelajaran mendalam (catatan)
Pemrosesan bahasa alami
- Word2vec (catatan)
- Sarung tangan (catatan)
- FastText (catatan)
- Textcnn (Catatan + Kode)
- Seq2seq (catatan + kode)
- Transformer (catatan + kode)
- Bert (catatan)
- LSTM+CRF untuk anotasi urutan (catatan)
- Model Tema (Catatan)