Aqui estão as seções:
Esta seção contém cheatsheets de conceitos básicos em ciência de dados que serão solicitados em entrevistas:
Esta seção contém livros que li sobre ciência de dados e aprendizado de máquina:
Esta seção contém exemplos de perguntas que foram feitas em entrevistas reais de ciência de dados:
Esta seção contém questões de estudo de caso relacionadas ao projeto de sistemas de aprendizado de máquina para resolver problemas práticos.
Esta seção contém um portfólio de projetos de ciência de dados concluídos por mim para fins acadêmicos, de autoaprendizagem e de hobby.
Para uma experiência visualmente mais agradável de navegação no portfólio, acesse jameskle.com/data-portfolio
Transfer Rec: Meu trabalho de pesquisa contínuo que cruza aprendizado profundo e sistemas de recomendação.
Recomendação de filmes: projetou 4 modelos diferentes que recomendam itens no conjunto de dados MovieLens.
Ferramentas: PyTorch, TensorBoard, Keras, Pandas, NumPy, SciPy, Matplotlib, Seaborn, Scikit-Learn, Surprise, Wordcloud
Trip Optimizer: usou XGBoost e algoritmos evolutivos para otimizar o tempo de viagem para veículos de táxi na cidade de Nova York.
Análise da cesta de mercado da Instacart: superou o desafio da análise da cesta de mercado da Instacart para prever quais produtos estarão no próximo pedido de um usuário.
Ferramentas: Pandas, NumPy, Matplotlib, XGBoost, Geopy, Scikit-Learn
Recomendação de moda: construiu um modelo baseado em ResNet que classifica e recomenda imagens de moda no banco de dados DeepFashion com base na similaridade semântica.
Classificação de moda: Desenvolvi 4 redes neurais convolucionais diferentes que classificam imagens no conjunto de dados Fashion MNIST.
Classificação da raça canina: projetou uma rede neural convolucional que identifica a raça canina.
Segmentação de estradas: Implementada uma rede totalmente convolucional para tarefa de segmentação semântica no conjunto de dados Kitty Road.
Ferramentas: TensorFlow, Keras, Pandas, NumPy, Matplotlib, Scikit-Learn, TensorBoard
Análise de equipes da Copa do Mundo de 2018: análise e visualização do conjunto de dados do FIFA 18 para prever as melhores escalações internacionais possíveis para 10 equipes na Copa do Mundo de 2018 na Rússia.
Análise de Artistas do Spotify: Análise e visualização de estilos musicais de 50 artistas diferentes com uma ampla gama de gêneros no Spotify.
Ferramentas: Pandas, NumPy, Matplotlib, Rspotify, httr, dplyr, tidyr, radarchart, ggplot2
Esta seção contém um portfólio de artigos de jornalismo de dados preenchidos por mim para clientes freelancers e para fins de autoaprendizagem.
Para uma experiência visualmente mais agradável de navegação no portfólio, acesse jameskle.com/data-journalism
As 10 técnicas estatísticas que os cientistas de dados precisam dominar
Tutorial de regressão logística
Tutorial de árvores de decisão
Tutorial de máquinas de vetores de suporte
Uma introdução amigável ao marketing baseado em dados para líderes empresariais
Os 10 algoritmos que os engenheiros de aprendizado de máquina precisam saber
12 coisas úteis para saber sobre aprendizado de máquina
Um tour pelos 10 principais algoritmos para iniciantes em aprendizado de máquina
As 10 técnicas de mineração de dados que os cientistas de dados precisam para sua caixa de ferramentas
Clustering e classificação em comércio eletrônico
O ABC de aprender a classificar
6 maneiras de depurar um modelo de aprendizado de máquina
Oito caminhos de carreira em aprendizado de máquina a serem seguidos hoje
Os 10 métodos de aprendizagem profunda que os profissionais de IA precisam aplicar
As 8 arquiteturas de redes neurais que os pesquisadores de ML precisam aprender
As 5 estruturas de aprendizado profundo com as quais todo aluno sério deve estar familiarizado
As 5 técnicas de visão computacional que mudarão a forma como você vê o mundo
Redes Neurais Convolucionais: O Modelo de Inspiração Biológica
Redes Neurais Recorrentes: A Potência da Modelagem de Linguagem
As 7 técnicas de PNL que mudarão a forma como você se comunica no futuro
As 5 tendências que dominam a visão computacional em 2018
As três estruturas de aprendizado profundo para reconhecimento de fala de ponta a ponta que potencializam seus dispositivos
Os 5 algoritmos para inferência eficiente de aprendizado profundo em pequenos dispositivos
As 4 técnicas de pesquisa para treinar modelos de redes neurais profundas com mais eficiência
As 2 arquiteturas de hardware para treinamento e inferência eficientes de redes profundas
10 práticas recomendadas de aprendizado profundo para manter em mente em 2020
Essas cheatsheets em PDF vêm de BecomingHuman.AI.