veranschaulichen
Zusammenfassung des Grundwissens über maschinelles Lernen, tiefes Lernen und Verarbeitung natürlicher Sprache.
Derzeit bezieht es sich hauptsächlich auf das Buch "Statistical Learning Methods" von Lehrer Li Hang, und einige Inhalte wie Xgboost , Clustering , Deep-Lernbezogene Inhalte , NLP-bezogene Inhalte usw. werden im Buch nicht erwähnt.
Da der Markdown -Parser von Github Latex nicht unterstützt, müssen die Notizen lokal verwendet werden, um normal zu durchsuchen, und Sie können auch direkt auf den unten angegebenen Blog -Link zugreifen.
Der Dokumentordner ist Hinweise, der Codeordner ist Code, der Datenordner ist der Datensatz, der von bestimmten Codes verwendet wird, und der Bildordner sind die Bilder im Abschnitt "Notizen".
Aufgrund der begrenzten Zeit und Energie stammt ein Teil des Codes von Github Open Source -Projekten wie SEQ2SEQ, Transformator und anderen Teilen des Codes, und einige Kapitelcodes sind ergänzt.
Maschinelles Lernen
- Lineare Regression (Notizen)
- Wahrnehmungsmaschine (Notizen + Code)
- KNN (Notizen + Code)
- Naive Bayes (Notizen + Code)
- Entscheidungsbaum (Notizen + Code)
- Logistische Regression (Notizen + Code)
- Maximale Entropie (Notizen + Code)
- SVM (Notizen + Code)
- Adaboost (Notizen + Code)
- GBDT (Notizen + Code)
- EM -Algorithmus (Notizen + Code)
- Hidden Markov -Modell (Notizen + Code)
- Bedingte Zufallsfeld (Notizen)
- Zufallswald (Notizen + Code)
- Xgboost (Notizen)
- Clustering (Notizen)
- Feature -Auswahl der Feature Engineering (Notizen)
- Dimensional Reduktionalgorithmus für Feature Engineering (Notizen)
Tiefes Lernen
- Neurales Netzwerk (Notizen + Code)
- RNN (Notizen)
- LSTM und Gru (Notizen)
- CNN (Notizen)
- Optimierungsmethoden im tiefen Lernen (Notizen)
Verarbeitung natürlicher Sprache
- Word2VEC (Notizen)
- Handschuh (Notizen)
- FastText (Notizen)
- Textcnn (Notizen + Code)
- SEQ2SEQ (Notizen + Code)
- Transformator (Notizen + Code)
- Bert (Notizen)
- LSTM+CRF für Sequenzanmerkungen (Notizen)
- Themenmodell (Notizen)