Perceber
Aviso
Por favor, siga as regras de redação ao solicitar PR. O não cumprimento pode resultar na rejeição do PR.
- Envie feedback como uma solicitação pull, referindo-se a como solicitar feedback por meio de uma solicitação pull.
- Consulte as regras de redação do Pull Request aqui.
- Além do GitHub, você também pode visualizá-lo no site GitBook.
No entanto, estamos planejando migrar para outro site porque a sintaxe do Latex é diferente. Você está planejando migrar quando chegar a hora?
- Se você tiver alguma dúvida ou dica para compartilhar, use a discussão.
- A ativação da comunidade é sempre bem-vinda!
- Verifique aqui o andamento do projeto de melhoria do repositório de entrevistas.
- Conforme mencionado no aviso, o progresso pode ser lento.
Perguntas da entrevista
? Estatística/Matemática
- Por favor, explique o que são valores e vetores próprios e por que eles são importantes.
- Por favor, diga-me o que são amostragem e reamostragem e as vantagens da reamostragem.
- O que são modelos de probabilidade e variáveis aleatórias?
- O que são funções de distribuição cumulativa e funções de densidade de probabilidade? Por favor, expresse-o com uma fórmula.
- O que é probabilidade condicional?
- O que são covariância e coeficiente de correlação? Por favor, expresse-o com uma fórmula.
- Qual é a definição de intervalo de confiança?
- Como você explicaria o valor p para alguém que não o conhece?
- O que significa R quadrado?
- Nesse caso devo usar a média ou mediana?
- Por que o teorema do limite central é útil?
- Por favor, explique a entropia. Obtenha informações, se possível.
- Quando posso usar uma metodologia paramétrica e quando posso usar uma metodologia não paramétrica?
- Qual é a diferença entre “probabilidade” e “probabilidade”?
- O que bootstrap significa nas estatísticas?
- Nos casos em que existem poucos parâmetros (algumas dezenas ou menos), como pode ser estabelecido um modelo de previsão?
- Você pode explicar a diferença entre bayesianos e frequentistas?
- O que é poder estatístico?
- Se houver valores faltantes, devo preenchê-los? Por que?
- Quais são os critérios para julgar outliers?
- Como calculo o tamanho da amostra necessário?
- Como controlar o preconceito?
- Quando as funções logarítmicas são úteis? Por favor, explique com um exemplo.
- Por favor, explique a distribuição de Bernoulli / distribuição binomial / distribuição de categorias / distribuição multinomial / distribuição normal gaussiana / distribuição t / distribuição qui-quadrado / distribuição F / distribuição beta / distribuição gama. Além disso, explique a correlação entre as distribuições.
- Estou prestes a embarcar em um avião para uma viagem de negócios. Você quer saber se deve levar guarda-chuva, então liga aleatoriamente para três amigos que moram em sua viagem de negócios e pergunta de forma independente se vai chover. Cada amigo diz a verdade 2/3 vezes e mente 1/3 vezes. Todos os três amigos disseram: “Sim. “Está chovendo.” Qual é a probabilidade de realmente chover?
? aprendizado de máquina
- Por favor, explique as métricas que você conhece. (ex. RMSE, MAE, recall, precisão...)
- Por que precisamos de normalização? Quais são os métodos de normalização?
- Por favor, explique os mínimos locais e os mínimos globais.
- Por favor, explique a maldição da dimensionalidade.
- Quais são algumas técnicas comuns de redução de dimensão?
- PCA é uma técnica de redução de dimensionalidade, uma técnica de compressão de dados e uma técnica de remoção de ruído. Você pode explicar por quê?
- Você pode explicar o que significam abreviações como LSA, LDA, SVD, etc. e como elas estão relacionadas entre si?
- Qual é a melhor maneira de explicar a Cadeia de Markov para alunos do ensino médio?
- Você precisa extrair tópicos de uma pilha de texto. Como você abordará isso?
- Por que o SVM funciona de maneira oposta, expandindo a dimensão? Por que o SVM é bom?
- Defenda os méritos de uma técnica antiga, o ingênuo Bayes, sobre outras boas técnicas de aprendizado de máquina.
- Qual é a métrica apropriada para regressão/classificação?
- Por favor, explique o apoio, a confiança e o levantamento da regra de associação.
- Você conhece o Método de Newton e o Gradiente Descendente entre as técnicas de otimização?
- Você tem alguma opinião sobre as diferenças entre a abordagem de aprendizado de máquina e a abordagem estatística?
- Quais são os problemas gerais das redes neurais artificiais (tradicionais antes do aprendizado profundo)?
- Qual você acha que é a base das inovações de aprendizagem profunda que estão surgindo agora?
- Você pode explicar a curva ROC?
- Você tem 100 servidores. Neste momento, por que a Floresta Aleatória deveria ser usada em vez da Rede Neural Artificial?
- Quais são as principais deficiências semânticas do K-means? (Além da grande quantidade de cálculos)
- Por favor, explique a regularização L1 e L2.
- O que é validação cruzada e como faço isso?
- Você conhece o XGBoost? Por que esse modelo é famoso no Kaggle?
- Quais são os métodos de conjunto?
- O que é um vetor de recursos?
- Qual é a definição de um bom modelo?
- 50 árvores de decisão pequenas são melhores do que uma árvore de decisão grande? Por que você acha isso?
- Por que a regressão logística é frequentemente usada em filtros de spam?
- Qual é a fórmula para regressão OLS (mínimos quadrados ordinários)?
? aprendizagem profunda
- O que é aprendizagem profunda? Qual é a diferença entre aprendizado profundo e aprendizado de máquina?
- O que são função de custo e função de ativação?
- Quais são os recursos e diferenças entre Tensorflow e PyTorch?
- O que é normalização de dados e por que ela é necessária?
- Conte-nos sobre a função de ativação que você conhece. (Sigmóide, ReLU, LeakyReLU, Tanh, etc.)
- Como devemos lidar com o overfitting?
- O que são hiperparâmetros?
- Por favor, conte-me sobre o método de inicialização de peso. E o que você usa muito?
- O que é uma máquina Boltzmann?
- Qual é o seu conhecimento de depuração ao usar TF, PyTorch, etc.?
- Qual é a maior desvantagem das redes neurais? O que é o One-Shot Learning que surgiu para isso?
- Atualmente, o ReLU é mais usado do que o Sigmoid.
- O que significa a palavra Não Linearidade e por que é necessária?
- Como aproximar uma função curva com ReLU?
- O que há de errado com ReLU?
- Por que existe preconceito?
- Como você explicaria o Gradient Descent em termos simples?
- Por que você precisa usar Gradiente? Quais são os eixos horizontal e vertical nesse gráfico? Como o gráfico seria desenhado na vida real?
- Por que as perdas às vezes aumentam durante a GD?
- Como você explicaria a retropropagação em termos simples?
- Por que o aprendizado profundo funciona bem apesar do problema dos mínimos locais?
- Como GD evita o problema dos mínimos locais?
- Como posso saber se a solução que encontrei é o Mínimo Global ou não?
- Por que separar conjuntos de treinamento e teste?
- Por que existe um conjunto de validação separado?
- O que significa dizer que o conjunto de teste está contaminado?
- O que é Regularização?
- Qual é o efeito da normalização em lote?
- Qual é o efeito do abandono?
- O que devo prestar atenção ao realmente usar o BN depois de aprendê-lo? E quanto ao código?
- O BN pode ser aplicado ao lado do gerador do GAN?
- Como você explicaria SGD, RMSprop e Adam com o melhor de seu conhecimento?
- O que significa Estocástico em SGD?
- Quais são os prós e os contras de tornar os minilotes pequenos?
- Que tal anotar a fórmula do impulso?
- Quantas linhas seriam necessárias para criar um classificador MNIST simples na versão MLP + CPU usando numpy?
- Quantas horas serão necessárias para escrever algo que funcione até certo ponto?
- Quantas linhas tem a retropropagação?
- Quanto será adicionado se mudarmos para a CNN?
- Quantas horas são necessárias para escrever um classificador MNIST simples em TF, PyTorch, etc.?
- Funcionaria bem se eu usasse MLP em vez de CNN?
- Você poderia explicar a última parte da camada?
- E se você quiser aprender com a perda de BCE, mas ver a situação com a perda de MSE?
- Por que é bom usar GPU ao fazer aprendizado profundo?
- Quero usar as duas GPUs. Como?
- Como calculo a memória GPU necessária para treinamento?
? píton
- Qual é a diferença entre listas e tuplas em Python?
- Quais são os principais recursos do Python?
- Que tipo de linguagem é python? Programação ou script?
- Python uma linguagem interpretada. Explicar.
- O que é vitalidade 8?
- Como a memória é gerenciada em Python?
- O que é namespace em Python?
- O que é PITONPATO?
- O que são módulos python? Cite alguns módulos integrados comumente usados em Python?
- O que são variáveis locais e variáveis globais em Python?
- O python diferencia maiúsculas de minúsculas?
- O que é conversão de tipo em Python?
- Como instalar o Python no Windows e definir a variável de caminho?
- A indentação é necessária em python?
- Qual é a diferença entre arrays e listas Python?
- O que são funções em Python?
- O que é
__init__
? - O que é uma função lambda?
- O que é self em Python?
- Como quebrar, continuar e passar funciona?
- O que
[::-1]
faz? - Como você pode randomizar os itens de uma lista em Python?
- Qual é a diferença entre iterador e iterável?
- Como você pode gerar números aleatórios em Python?
- Qual é a diferença entre intervalo e xrange?
- Como você escreve comentários em python?
- O que é colher e descascar?
- Quais são os geradores em python?
- Como você colocará a primeira letra da string em maiúscula?
- Como você converterá uma string para letras minúsculas?
- Como comentar várias linhas em python?
- O que são doutrinas em Python?
- Qual é o propósito de is, not e in operadores?
- Qual é o uso das funções help() e dir() em Python?
- Sempre que o Python é encerrado, por que toda a memória não é desalocada?
- O que é um dicionário em Python?
- Como os operadores ternários podem ser usados em python?
- O que isso significa:
*args
, **kwargs
? E por que o usaríamos? - O que len() faz?
- Explique os métodos split(), sub(), subn() do módulo “re” em Python.
- O que são índices negativos e por que são usados?
- O que são pacotes Python?
- Como os arquivos podem ser excluídos em Python?
- Quais são os tipos integrados de python?
- Que vantagens os arrays NumPy oferecem em relação às listas Python (aninhadas)?
- Como adicionar valores a um array python?
- Como remover valores de um array python?
- Python tem conceitos de OOps?
- Qual é a diferença entre cópia profunda e superficial?
- Como o multithreading é alcançado em Python?
- Qual é o processo de compilação e vinculação em python?
- O que são bibliotecas Python? Cite alguns deles.
- Para que é usada a divisão?
- Como importar módulos em python?
- Explique a herança em Python com um exemplo.
- Como as classes são criadas em Python?
- O que é patch de macaco em Python?
- Python suporta herança múltipla?
- O que é polimorfismo em Python?
- Definir encapsulamento em Python?
- Como você faz abstração de dados em Python?
- O python faz uso de especificadores de acesso?
- Como criar uma classe vazia em Python?
- O que um objeto() faz?
- Qual é a função de mapa em Python?
- Python numpy é melhor que listas?
- O que é GIL na linguagem Python?
- O que torna o CPython diferente do Python?
- O que são decoradores em Python?
- O que é internação de objeto?
- O que é @classmethod, @staticmethod, @property?
rede
- Por favor, explique cada camada do TCP/IP.
- Por favor, explique a diferença entre a camada 7 do OSI e a camada TCP/IP.
- Compare Quadro, Pacote, Segmento e Datagrama.
- Por favor, explique a diferença entre TCP e UDP.
- Compare os cabeçalhos do TCP e do UDP.
- Por favor, compare e explique o handshake de 3 vias e o handshake de 4 vias do TCP.
- Por que as etapas são diferentes entre o processo de estabelecimento de conexão do TCP (etapa 3) e o processo de encerramento da conexão (etapa 4)?
- O que acontece se um pacote transmitido antes do servidor transmitir o sinalizador FIN chegar depois do pacote FIN devido ao atraso de roteamento ou retransmissão devido à perda de pacote?
- Por que você define o número de sequência inicial, ISN, gerando um número aleatório em vez de começar em 0?
- Explique HTTP e HTTPS e explique as diferenças.
- Explique a estrutura dos cabeçalhos de solicitação/resposta HTTP.
- Compare os processos de operação HTTP e HTTPS.
- O que é CORS?
- Compare/explique os métodos HTTP GET e POST.
- Por favor, explique cookies e sessões.
- O que é DNS?
- Por favor, explique o conceito de REST e RESTful e me diga a diferença.
- O que é um soquete? Por favor, mostre um exemplo simples de criação de um soquete em uma linguagem com a qual você se sinta confortável.
- Explique a diferença entre Socket.io e WebSocket.
- Por favor, explique a diferença entre IPv4 e IPv6.
- O que é endereço MAC?
- Explique a diferença entre roteador, switch e hub.
- O que é SMTP?
- Acessei
www.google.com
com meu laptop. Por favor, explique detalhadamente o processo de envio e recebimento de uma solicitação. - Apresente brevemente várias topologias de rede.
- Por favor, explique a máscara de sub-rede.
- O que é encapsulamento de dados?
- Por favor, explique o DHCP.
- Por favor, explique alguns protocolos de roteamento. (ex. estado do link, vetor de distância)
- O que é Ethernet?
- Por favor, explique a diferença entre cliente e servidor.
- Explique a diferença entre atraso, tempo (jitter) e taxa de transferência.
sistema operacional
- Por favor, diga-me a diferença entre processo e thread (Processo vs Thread).
- Explique por que você está usando multithread em vez de multiprocesso.
- Por favor, explique a localidade dos caches.
- Por favor, explique Thread-safe. (dica: seção crítica)
- Por favor, explique a diferença entre mutex e semáforo.
- Por favor, explique o que é um agendador e os critérios para dividi-lo em curto prazo/médio prazo/longo prazo.
- Explique brevemente os escalonadores de CPU FCFS, SJF, SRTF, Priority Scheduling e RR.
- Explique a diferença entre síncrono e assíncrono.
- Explique brevemente qual é a sua estratégia de gerenciamento de memória.
- Por favor, explique a memória virtual.
- Por favor, explique o conceito e as condições do impasse.
- Por favor, explique a diferença entre threads de nível de usuário e threads de nível de kernel.
- Por favor, explique a fragmentação externa e a fragmentação interna.
- Explique o que é mudança de contexto e liste o processo.
- Por favor, explique a troca.
? estrutura de dados
- lista vinculada
- lista vinculada única
- lista duplamente vinculada
- lista vinculada circular
- tabela hash
- pilha
- fila
- gráfico
- árvore
- árvore binária
- árvore binária completa
- árvore binária completa
- bst (árvore de pesquisa binária)
- heap (pilha binária)
- pilha mínima
- pilha máxima
- árvore rubro-negra
- b+ árvore
? algoritmo
- Complexidade de tempo e espaço
- Algoritmo de classificação
- Classificação por bolha
- Ordenação por seleção
- Classificação de inserção
- Mesclar classificação
- Classificação de pilha
- Classificação rápida
- Classificação de contagem
- Classificação de raiz
- Dividir e conquistar
- Programação Dinâmica
- Algoritmo ganancioso
- Gráfico
- Traversal do gráfico: BFS, DFS
- Caminho mais curto
- Dijkstra
- Floyd-Warshall
- Bellman-Ford
- Árvore de abrangência mínima
- União-descoberta
- Classificação topológica
Colaboradores
Referências
- Perguntas da entrevista sobre ciência de dados por zzsza
- perguntas incríveis da entrevista por DopplerHQ
- Entrevista_Question_for_Beginner por JaeYeopHan
- entrevista técnica por WeareSoft