ilustrar
Resumo do conhecimento básico do aprendizado de máquina, aprendizado profundo e processamento de linguagem natural.
Atualmente, refere-se principalmente ao livro do professor Li Hang "Métodos de Aprendizagem Estatística" e a alguns conteúdos como XGBoost , Clustering , conteúdo profundo relacionado à aprendizagem , conteúdo relacionado ao NLP etc. não são mencionados no livro.
Como o analisador de marcação do Github não suporta o LATEX, as notas precisam ser usadas localmente para navegar normalmente e você também pode acessar diretamente o link do blog abaixo.
A pasta do documento é notas, a pasta de código é o código, a pasta de dados é o conjunto de dados usado por determinados códigos e a pasta de imagens são as imagens usadas na seção Notas.
Devido ao tempo e energia limitados, parte do código vem de projetos de código aberto do GitHub, como seq2seq, transformador e outras partes do código, e alguns códigos de capítulo devem ser suplementados.
Aprendizado de máquina
- Regressão linear (notas)
- Máquina de percepção (Notas + código)
- KNN (Notas + código)
- Bayes ingênuo (Notas + código)
- Árvore de decisão (notas + código)
- Regressão logística (Notas + código)
- Entropia máxima (Notas + código)
- SVM (Notas + Código)
- Adaboost (Notas + código)
- GBDT (Notas + Código)
- Algoritmo EM (Notas + Código)
- Modelo Hidden Markov (Notas + Código)
- Campo aleatório condicional (notas)
- Floresta aleatória (Notas + Código)
- XGBOOST (NOTAS)
- Clustering (Notas)
- Seleção de recursos de engenharia de recursos (notas)
- Algoritmo de redução dimensional para engenharia de recursos (notas)
Aprendizado profundo
- Rede Neural (Notas + Código)
- RNN (Notas)
- LSTM e GRU (NOTAS)
- CNN (Notas)
- Métodos de otimização em aprendizado profundo (notas)
Processamento de linguagem natural
- Word2vec (Notas)
- Luva (notas)
- FastText (notas)
- TextCnn (Notas + Código)
- SEQ2SEQ (Notas + Código)
- Transformador (Notas + código)
- Bert (Notas)
- LSTM+CRF para anotação de sequência (notas)
- Modelo de Tema (Notas)