Recursos de entrevista de ciência de dados
Atualização: Com base na vasta experiência em entrevistas nos últimos anos, decidi recentemente lançar um canal dedicado para ajudar indivíduos a se destacarem em Ciência de Dados. Meu objetivo é criar um recurso abrangente para quem deseja revisitar o básico antes de uma próxima entrevista ou dominar as habilidades e o conhecimento aprofundado necessários para ter sucesso em entrevistas de Ciência de Dados e aplicar a Ciência de Dados na prática. Este canal tem como objetivo proporcionar uma compreensão clara das diversas técnicas utilizadas no dia-a-dia, abrangendo uma vasta gama de tópicos de Machine Learning. Sinta-se à vontade para explorá-lo aqui:
Em primeiro lugar, obrigado por visitar este repositório, parabéns por fazer uma ótima escolha de carreira. Meu objetivo é ajudá-lo a conseguir um trabalho incrível em Ciência de Dados com o qual você sempre sonhou, compartilhando minha experiência, entrevistando fortemente em grandes empresas baseadas em produtos e startups de rápido crescimento, espero que seja útil.
Com o aumento na demanda por tantos Cientistas de Dados, é realmente difícil ser selecionado e aceito para uma entrevista. Neste repositório, incluo tudo, desde ser selecionado com sucesso e arrasar naquela entrevista até conseguir aquela posição incrível, certifique-se de acertar com os seguintes recursos.
Cada recurso listado aqui é verificado pessoalmente por mim e a maioria deles eu usei pessoalmente, o que me ajudou muito.
Aviso: Ciência de Dados/Aprendizado de Máquina tem um domínio muito grande e há muitas coisas para aprender. Esta não é de forma alguma uma lista exaustiva e serve apenas para ajudá-lo se você estiver lutando para encontrar bons recursos para iniciar sua preparação. No entanto, tento cobrir e atualizar isso com frequência e meu objetivo é cobrir e unificar tudo em um recurso que você possa usar para arrasar nessas entrevistas!
Por favor, deixe uma estrela se você aprecia o esforço.
Nota: Para contribuição, consulte Contribution.md
Como conseguir uma entrevista?
Em primeiro lugar, desenvolva as habilidades necessárias e conheça os fundamentos . Esses são alguns dos horizontes com os quais você deve estar extremamente confortável -
- Compreensão do negócio (isto é extremamente crítico em todos os níveis de antiguidade, mas especificamente para pessoas com mais de 3 anos de experiência)
- SQL e bancos de dados (muito crucial)
- Habilidades de programação (de preferência em Python, se você conhece Scala, pontos extras para algumas funções específicas)
- Matemática (Probabilidade, Estatística, Álgebra Linear e Cálculo) - https://medium.com/@rbhatia46/essential-probability-statistics-concepts-before-data-science-bb787b7a5aef
- Aprendizado de máquina (isso inclui aprendizado profundo) e construção de modelo
- Estruturas de dados e algoritmos (obrigatório e obrigatório para empresas baseadas em produtos importantes como FAANG)
- Compreensão do domínio (opcional para a maioria das vagas, embora muito crítico para algumas funções com base nas necessidades da empresa)
- Revisão da literatura (obrigatória para funções baseadas em pesquisa): Ser capaz de ler e compreender um novo artigo de pesquisa é uma das habilidades mais essenciais e exigentes necessárias na indústria hoje, à medida que a cultura de Pesquisa e Desenvolvimento e a inovação crescem na maioria das boas organizações .
- Habilidades de comunicação – Ser capaz de explicar as análises e os resultados às partes interessadas e aos executivos da empresa está se tornando uma habilidade muito importante para os cientistas de dados atualmente.
- Algum conhecimento de engenharia (não obrigatório, mas é bom ter) - Ser capaz de desenvolver uma API RESTful, escrever código limpo e elegante, programação orientada a objetos são algumas das coisas em que você pode se concentrar para obter alguns pontos extras.
- Conhecimento de big data (não obrigatório para a maioria das vagas, mas é bom ter) - Spark, Hive, Hadoop, Sqoop.
Construa uma marca pessoal
- Desenvolva um bom GitHub/portfólio de casos de uso que você resolveu, sempre se esforce para resolver casos de uso ponta a ponta, que demonstrem todo o ciclo de vida da Ciência de Dados, desde a compreensão do negócio até a implantação do modelo.
- Escreva blogs, crie um canal no YouTube, se você gosta de ensinar, escreva um livro.
- Trabalhe em um currículo/CV digital, fácil de abrir, fácil de ler, limpo, conciso e facilmente personalizável, sempre inclua seus links de demonstração e o código-fonte de cada caso de uso que você resolveu.
- Participe de competições Kaggle, crie um bom perfil Kaggle e envie-o a potenciais empregadores para aumentar as chances de conseguir uma entrevista por telefone rapidamente.
Desenvolva boas conexões , através do LinkedIn, participando de conferências e fazendo tudo o que puder, é muito importante conseguir referências e iniciar o processo de entrevista por meio de boas conexões. Conectar-se regularmente com cientistas de dados que trabalham nas principais organizações baseadas em produtos, startups de rápido crescimento, construir uma rede, de forma lenta e constante, é muito importante.`
Algumas dicas sobre currículo/CV:
Descreva funções anteriores e um impacto que você causou de forma quantificável , seja conciso e repito, quantifique o impacto, em vez de falar com fatos que não têm relevância. De acordo com o Google Recruiters, use a fórmula XYZ - Accomplished [X] as measured by [Y], by doing [Z]
Seja curto, de preferência não mais do que 2 páginas, como você deve saber, um recrutador médio examina seu currículo apenas por 6 segundos e toma uma decisão com base nisso.
Se você é um novato e não tem experiência, tente resolver casos de uso ponta a ponta e mencione-os em seu currículo, de preferência com o link de demonstração (facilita para o recrutador) e o link para o código-fonte em Github.
Evite muito jargão técnico, e nem é preciso dizer, não mencione nada sobre o qual você não tenha certeza, pois isso pode se tornar um grande gargalo durante sua entrevista.
Alguns links úteis:
- Assessoria na construção de projetos de portfólio de dados
- Como escrever um currículo matador de engenharia de software
- Obtenha seu currículo de ciência de dados após o ATS
- Como escrever um currículo de desenvolvedor que os gerentes de contratação realmente leiam
Se você quiser revisar rapidamente seus princípios básicos de matemática, siga isto: https://media-exp2.licdn.com/dms/document/C4D1FAQFzFmR919-Erw/feedshare-document-pdf-an analisado/0/1655384106479?e=1656547200&v=beta&t=9bm4OUyWfM1dQR8LWXsLrGDqYz_Yr_e7TJxHXLXe36I
Se você quiser revisar rapidamente seus princípios básicos de estatísticas e ML, siga isto: https://media-exp2.licdn.com/dms/document/C4D1FAQFLvzVgVxYAAA/feedshare-document-pdf-analyzed/0/1656265480370?e=1657152000&v=beta&t=RD90ZEx3x2VLUGSthO-1uYKadzwTRixKRg3s8j2nvOc
Probabilidade, Estatística e Álgebra Linear
- Compreenda os fundamentos da Estatística Descritiva (muito importante para uma entrevista)
- 40 Pergunta sobre probabilidade para uma entrevista de ciência de dados
- 40 problemas e respostas de entrevistas estatísticas para cientistas de dados
- Probabilidade e Estatística no contexto do Deep Learning
- Probabilidade versus probabilidade?
- Métodos Bootstrap – O canivete suíço de qualquer cientista de dados
- Intervalos de confiança explicados de forma simples para cientistas de dados
- Valor P explicado simplesmente para cientistas de dados
- PDF não é uma probabilidade
- 5 algoritmos de amostragem que todo cientista de dados deveria conhecer
- As 10 técnicas estatísticas que os cientistas de dados precisam dominar
- Curso intensivo de álgebra linear aplicada?
SQL e aquisição de dados
Este é provavelmente o ponto de entrada do seu projeto de Ciência de Dados. SQL é uma das habilidades mais importantes para qualquer Cientista de Dados.
- 5 problemas comuns de entrevistas SQL para cientistas de dados
- 46 perguntas para testar um cientista de dados em SQL
- 30 perguntas da entrevista SQL com curadoria de FAANG por um ex-cientista de dados do Facebook
- Perguntas da entrevista SQL
- Como se sair bem em entrevistas de ciência de dados - SQL
- 3 perguntas SQL obrigatórias para passar na entrevista de ciência de dados
- 10 consultas SQL frequentes em entrevistas
- Perguntas da entrevista técnica sobre ciência de dados: SQL e codificação
- Como otimizar consultas SQL - Datacamp
- Dez conceitos de SQL que você deve conhecer para entrevistas de ciência de dados
Preparação e visualização de dados
- 5 algoritmos de seleção de recursos que todo cientista de dados deve conhecer
- 6 maneiras diferentes de compensar valores ausentes em um conjunto de dados
- Uma breve visão geral das técnicas de detecção de outliers
- Limpeza e preparação de dados com Python para ciência de dados – práticas recomendadas e pacotes úteis
- Quando usar qual gráfico para visualização
- Maneiras de detectar e remover outliers
- Lidando com desequilíbrios de classe no aprendizado de máquina
- Maneiras mais inteligentes de codificar dados categóricos
- Folha de referências de Numpy e Pandas
- 3 métodos para lidar com outliers
- Técnicas de seleção de recursos
- Por que, como e quando dimensionar seus recursos
- Tudo o que você precisa saber sobre gráficos de dispersão
- Como selecionar recursos para aprendizado de máquina?
- 10 maneiras de seleção de recursos?
Algoritmos Clássicos de Aprendizado de Máquina
- Todos os algoritmos de aprendizagem explicados em 14 minutos
1. Regressão Logística
- Tudo sobre regressão logística em um artigo
- Compreendendo a regressão logística passo a passo
- Regressão Logística - Explicação curta e clara - 9 minutos?
- Regressão Linear vs Regressão Logística?
- 30 perguntas para testar um cientista de dados em regressão logística
- Regressão Logística - Entenda tudo (Teoria + Matemática + Codificação) em 1 vídeo?
- Lasso, Ridge e Regressão Logística, tudo em um vídeo?
2. Regressão Linear
- 30 perguntas para testar um cientista de dados em regressão linear
- Regressão Linear - Entenda tudo (Teoria + Matemática + Codificação) em 1 vídeo?
- 5 tipos de regressão e suas propriedades
- Regressão de Ridge - claramente explicada?
- Regressão Lasso - claramente explicada?
3. Algoritmos baseados em árvore/conjunto
- 30 perguntas para testar um cientista de dados em modelos baseados em árvore
- Índice de Gini v/s Entropia de Informação
- Árvore de decisão vs. floresta aleatória – qual algoritmo você deve usar?
- Por que Random Forest não funciona bem para séries temporais?
- Guia completo para modelos de conjunto
- A matemática simples por trás de 3 critérios de divisão de árvore de decisão
4. K-vizinhos mais próximos
- Perguntas fundamentais da entrevista no KNN - uma atualização rápida
- 30 perguntas para testar um cientista de dados no KNN
- Prós e contras do KNN
- Algoritmo KNN - Entenda tudo (Teoria + Matemática + Codificação) em 1 vídeo?
5. Máquinas de vetores de suporte
- Tudo sobre SVMs – Matemática, Terminologia, Intuição, Kernels em um artigo
- 25 perguntas para testar um cientista de dados em SVMs
6. Bayes ingênuo
- 12 dicas para aproveitar ao máximo Naive Bayes
- Naive Bayes - Entenda tudo (teoria + matemática + codificação) em 1 vídeo?
- 6 etapas fáceis para aprender Naive Bayes
Série temporal
- 40 perguntas para testar um cientista de dados em séries temporais
- 11 Métodos Clássicos de Previsão de Séries Temporais
- Perguntas da entrevista no ARIMA?
Aprendizagem não supervisionada
- Os DOs e DONTs do PCA (Análise de Componentes Principais)
- Uma introdução ao t-SNE: DataCamp
- Reduzindo Dimensionalmente Espremendo as coisas boas
- Redução de Dimensionalidade para Leigos: Parte 1 - Intuição
- Explicação detalhada do algoritmo DBSCAN
Sistemas de recomendação
- Sistemas de recomendação em poucas palavras
Aprendizado profundo
- Por que a regularização reduz o overfitting em redes neurais profundas?
- Prós e contras das redes neurais
- Quando não usar redes neurais
- 40 perguntas para testar um cientista de dados em aprendizagem profunda
- 21 perguntas populares da entrevista de aprendizado profundo
- Perguntas da entrevista de aprendizado profundo - Edureka?
- Funções de ativação em uma rede neural - explicadas
- Gradiente desaparecendo e explodindo - claramente explicado?
- Viés e variância - explicados de forma muito clara?
- Por que usar ReLU em vez de Sigmoid
- 25 perguntas de entrevista de aprendizado profundo para testar seu conhecimento
- 10 práticas recomendadas de aprendizado profundo para manter em mente em 2020
GenAI e LLMs
- LoRA explicou?
- RAG v/s Ajuste fino v/s Prompt Engineering?
- Codificadores cruzados vs bi-codificadores: um mergulho profundo nos métodos de codificação de texto
- RAG 101
- IA generativa em poucas palavras?
- Explicação detalhada da Teoria BERT em um vídeo?
- Explicação detalhada da Teoria dos Transformadores em um vídeo?
- A matemática por trás de matrizes de Atenção: Chaves, Consultas e Valores?
Projeto de sistema de aprendizado de máquina
- Como responder a qualquer pergunta da entrevista sobre design de sistema de aprendizado de máquina
Interpretabilidade do aprendizado de máquina
- Quatro perguntas sobre como decifrar o mundo dos modelos de aprendizado de máquina
- Explicação do aprendizado de máquina - Crash Course da Kaggle
- Valores SHAP explicados de forma simples?
Estudos de caso
Os estudos de caso são extremamente importantes para entrevistas, abaixo estão alguns recursos para praticar, pense primeiro antes de olhar as soluções.
- Amanhecer dos agregadores de táxi
- Otimizando preços de produtos para um fornecedor online
- Dicas para uma entrevista de estudo de caso
- Previsão de preço Mercari
- Pipeline de classificação de texto multiclasse ponta a ponta
- Pipeline de classificação de imagens multiclasse ponta a ponta
- Previsão em larga escala para mais de 1000 produtos - Nagarro?
- Clustering e classificação em comércio eletrônico
- O ABC de aprender a classificar
- Estudo de caso de ciência de dados: otimizando a colocação de produtos no varejo
PNL
- 30 perguntas para testar um cientista de dados em PNL
- 11 perguntas mais comuns em entrevistas de PNL para iniciantes
- Como resolver 90% dos problemas de PNL
- Perguntas feitas sobre funções de PNL em empresas
- Métodos baseados em vetores para pesquisa de similaridade (TF-IDF, BM25, SBERT)?
- Compreendendo o BERT em detalhes - uma das melhores playlists para entender os fundamentos e o funcionamento interno do BERT, uma grande mensagem para Chris McCormick?
- Incorporações de palavras, CBoW e Skipgram?
- CBoW v/s Skipgram: pergunta da entrevista sobre ciência de dados?
Entrevistas de ciência de dados na FAANG e empresas similares
- Problemas práticos de entrevista com cientistas de dados da Amazon
- Perguntas e respostas da entrevista sobre ciência de dados da Microsoft
- Perguntas de solução de problemas para entrevista de ciência de dados no Google
Tornando-se um cientista de dados da Rockstar (leia se tiver tempo extra)
Passar por eles definitivamente adicionará pontos extras de brownie, então não perca se tiver tempo.
- As 13 principais habilidades para se tornar um cientista de dados Rockstar
- Entenda esses 4 conceitos de ML para parecer um mestre
- 12 coisas que eu gostaria de saber antes de começar como Cientista de Dados
- Entenda o pipeline de ciência de dados
- Glossário de ciência de dados Kaggle
- Glossário de aprendizado de máquina do Google
- Executando suas previsões de ML 50 vezes mais rápido - Hummingbird
- 3 erros que você não deve cometer em uma entrevista de ciência de dados
- Como encontrar as importâncias dos recursos para os modelos BlackBox?
Estruturas de dados e algoritmos (opcional)
Embora isso possa ser opcional, não perca se a descrição do cargo solicitar explicitamente isso e, especialmente, nunca perca se você estiver entrevistando na FAANG e organizações semelhantes, ou se tiver experiência em CS. Você não precisa ser tão bom quanto um SDE nisso, mas pelo menos saber o básico.
- Guia do cientista de dados para estruturas de dados e algoritmos
- Manipulando árvores em entrevista algorítmica de ciência de dados
- Uma introdução simples às listas vinculadas para cientistas de dados
- Programação Dinâmica para Cientistas de Dados
- 3 conceitos de programação para cientistas de dados
- Cientistas de dados, os 5 algoritmos gráficos que você deve conhecer
Engenharia e Implantação
- Guia para leigos para cientistas de dados criarem APIs em minutos
- Leve seus modelos de aprendizado de máquina para produção com estas 5 etapas simples
- Duas maneiras de implantar seus modelos de ML
- Como implantar um modelo Keras como um aplicativo web por meio do Flask
- Como escrever aplicativos da Web usando Python simples para cientistas de dados?
Big Data e Spark
- 55 perguntas da entrevista do Apache Spark
- 10 perguntas que você pode esperar em uma entrevista Spark
- Perguntas da entrevista do Hive
- As 20 principais perguntas da entrevista do Apache Spark?
- Perguntas da entrevista do Spark - A playlist inteira?
- Outra lista de reprodução fabulosa para perguntas da entrevista do Spark?
- Dicas práticas do PySpark para cientistas de dados
- 3 maneiras de paralelizar seu código usando Spark
- Datashader – Revelando a estrutura do Big Data genuinamente?
- Lightnings Talk: O que se deve saber sobre Spark-MLlib?
- Resolvendo a exceção “Container Killed by Yarn For Exceeding Memory Limits” no Apache Spark
Algumas coisas incríveis sobre Python e Spark
Você não pode perder isso se estiver sendo entrevistado para uma função de Big Data.
- Melhorando o desempenho do Python e do Spark?
- Python de alto desempenho no Spark?
- UDFs vetorizados: análise escalonável com Python e PySpark?
Perguntas gerais da entrevista em todo o espectro (vídeo)
- Perguntas comuns da entrevista sobre ciência de dados - Edureka
- Pergunta comum da entrevista sobre aprendizado de máquina - Edureka
- Os 5 principais algoritmos usados em ciência de dados
- Perguntas comuns da entrevista sobre ciência de dados - Analytics University
- 3 tipos de perguntas da entrevista sobre ciência de dados
- Lições aprendidas da maneira mais difícil - Entrevista Hackeando a Ciência de Dados
- Como é entrevistar como cientista de dados
- 5 dicas para conseguir um emprego em ciência de dados
- 8 algoritmos de ciência de dados usados com frequência
- Entrevista prática baseada em cenário
- KNN v/s K Médias
Perguntas gerais da entrevista em todo o espectro (leitura)
- O guia de entrevista de ciência de dados
- As 30 principais perguntas da entrevista sobre ciência de dados
- 35 perguntas importantes da entrevista sobre ciência de dados
- 100 perguntas da entrevista sobre ciência de dados na FAANG
- O guia de entrevista mais abrangente sobre ciência de dados
- 41 perguntas essenciais da entrevista de ML - Springboard
- 30 dias de preparação para entrevista de ciência de dados - iNeuron
- 109 perguntas da entrevista sobre ciência de dados - trampolim
- Perguntas mais frequentes da entrevista sobre ciência de dados na Índia - Springboard
- Lista de startups de IA na Índia e recursos para se preparar para a entrevista
- 5 perguntas da entrevista para prever um bom cientista de dados
- 8 maneiras comprovadas de melhorar a precisão do seu modelo de ML
- 60 perguntas da entrevista sobre aprendizado de máquina - AnalyticsIndiaMag
- A grande lista de recursos para entrevistas de DS e ML
- 100 perguntas básicas da entrevista sobre ciência de dados junto com respostas
- 40 perguntas da entrevista feitas na entrevista Startups in ML/DS
- Minha experiência em entrevista de emprego em ciência de dados/aprendizado de máquina: lista de perguntas sobre DS/ML/DL – aprendizado de máquina em ação
- Como me preparo para uma entrevista por telefone de Data Science no Airbnb
- Melhor algoritmo de ML para problemas de regressão
- Como se sair bem na entrevista presencial de ciência de dados
- Como conseguir um emprego de Cientista de Dados no Airbnb
- 120 perguntas da entrevista sobre ciência de dados (de todos os domínios)
- Compreendendo a compensação entre polarização e variância
- Você precisa dessas folhas de dicas se estiver lidando com algoritmos de ML
- Sinais de alerta em uma entrevista de ciência de dados
- A opinião de um cientista de dados sobre as perguntas da entrevista
- O que é entropia cruzada (explicação curta e agradável)
- Qual é a aparência do perfil ideal de um cientista de dados
- 25 perguntas divertidas para uma entrevista de aprendizado de máquina
- Como se preparar para entrevistas de aprendizado de máquina
- Como desenvolver um modelo de aprendizado de máquina do zero
- Guia ponta a ponta para um projeto de aprendizado de máquina
- Classificação vs Regressão
- Medidas matemáticas obrigatórias para todo cientista de dados
- De onde veio o mínimo quadrado
- Regularização em aprendizado de máquina - explicada
Leituras interessantes
- 3 transições comuns de carreira em ciência de dados e como fazê-las acontecer
- Navegando no cenário da carreira em ciência de dados
- Qual modelo e quantos dados