Uma pessoa que trabalha na área de IA e não sabe matemática é como um político que não sabe persuadir. Ambos têm uma área inevitável para trabalhar!
Há uma semana, escrevi um artigo sobre Como entrar na ciência de dados em 2021 e, desde então, recebi vários e-mails de pessoas de todo o mundo perguntando quanta matemática é necessária na ciência de dados.
Não vou mentir: é muita matemática .
E esse é um dos motivos que desanima muitos iniciantes. Depois de muita pesquisa e conversas com vários veteranos na área, compilei este guia prático que cobre todos os fundamentos da matemática que você precisa saber . Os conceitos mencionados abaixo geralmente são abordados ao longo de vários semestres na faculdade, mas eu os resumi aos princípios básicos nos quais você pode se concentrar.
Este guia é um salva-vidas absoluto para iniciantes, para que você possa estudar os tópicos mais importantes, e um recurso ainda melhor para profissionais como eu, que precisam de uma rápida compreensão desses conceitos.
Observação : você não precisa conhecer todos os conceitos (abaixo) para conseguir seu primeiro emprego em Ciência de Dados. Tudo que você precisa é uma compreensão firme dos fundamentos. Concentre-se neles e consolide-os.
O conhecimento de álgebra talvez seja fundamental para a matemática em geral. Além de operações matemáticas como adição, subtração, multiplicação e divisão, você precisará saber o seguinte:
Expoentes
Radicais
Fatoriais
Resumos
Notações Científicas
Álgebra Linear é a principal ferramenta de computação matemática em Inteligência Artificial e em muitas áreas da Ciência e Engenharia. Nisto, 4 objetos matemáticos primários e suas propriedades precisam ser compreendidos:
Escalares - um único número (pode ser real ou natural).
Vetores - uma lista de números, organizados em ordem. Considere-os como pontos no espaço com cada elemento representando a coordenada ao longo de um eixo.
Matrizes - uma matriz 2-D de números onde cada número é identificado por 2 índices.
Tensores - uma matriz ND de números (N>2), organizada em uma grade regular com eixos N. Importante em aprendizado de máquina, aprendizado profundo e visão computacional
Autovetores e autovalores - vetores especiais e sua quantidade escalar correspondente. Entenda o significado e como encontrá-los.
Decomposição de valores singulares - fatoração de uma matriz em 3 matrizes. Entenda as propriedades e aplicações.
Análise de Componentes Principais (PCA) - entenda o significado, propriedades e aplicações.
Propriedades como produto escalar, produto vetorial e produto Hadamard também são úteis para conhecer.
O cálculo lida com mudanças em parâmetros, funções, erros e aproximações. O conhecimento prático de cálculo multidimensional é fundamental na Ciência de Dados. A seguir estão os conceitos mais importantes (embora não exaustivos) em Cálculo:
Derivadas - regras (adição, produto, regra da cadeia etc), derivadas hiperbólicas (tanh, cosh etc) e derivadas parciais.
Cálculo Vetorial/Matricial - diferentes operadores derivados (Gradiente, Jacobiano, Hessiano e Laplaciano)
Algoritmos de gradiente - máximos e mínimos locais/globais, pontos de sela, funções convexas, lotes e minilotes, descida de gradiente estocástica e comparação de desempenho.
Estatísticas Básicas - Média, Mediana, Moda, Variância, Covariância, etc.
Regras básicas em probabilidade - eventos (dependentes e independentes), espaços amostrais, probabilidade condicional.
Variáveis aleatórias - contínuas e discretas, expectativa, variância, distribuições (conjuntas e condicionais).
Teorema de Bayes - calcula a validade das crenças. O software bayesiano ajuda as máquinas a reconhecer padrões e tomar decisões.
Estimativa de Máxima Verossimilhança (MLE) - estimativa de parâmetros. Requer conhecimento de conceitos fundamentais de probabilidade (probabilidade conjunta e independência de eventos).
Distribuições Comuns - binomial, poisson, bernoulli, gaussiana, exponencial.
Um campo importante que fez contribuições significativas para a IA e o Deep Learning, e ainda é desconhecido para muitos. Pode ser pensado como um amálgama de cálculo, estatística e probabilidade.
Entropia - também chamada de Entropia de Shannon. Usado para medir a incerteza de um experimento.
Entropia Cruzada - compara duas distribuições de probabilidade e nos diz quão semelhantes elas são.
Divergência de Kullback Leibler - outra medida de quão semelhantes são duas distribuições de probabilidade.
Algoritmo Viterbi - amplamente utilizado em Processamento de Linguagem Natural (PNL) e Fala
Codificador-Decodificador - usado em RNNs de tradução automática e outros modelos.
Na Inteligência Artificial, a matemática é muito importante. Sem ele, é comparável a um corpo humano sem alma. Você pode tratar os conceitos matemáticos como uma forma de pagamento conforme o uso: sempre que um conceito estranho aparecer, pegue-o e devore-o! O guia acima apresenta um recurso mínimo, mas abrangente, para compreender qualquer tipo de tópico ou conceito em IA.
Boa sorte!
Se você acha que este roteiro pode ser melhorado, abra um PR com todas as atualizações e envie quaisquer problemas. Continuaremos a melhorar isso, então você pode considerar assistir/marcar com estrela este repositório para revisitá-lo no futuro.
Dê uma olhada no guia de contribuição para saber como atualizar o roteiro.
Abra uma solicitação pull com melhorias
Discuta ideias em questões
Espalhe a palavra
Entre em contato com qualquer feedback
Este roteiro foi criado por Jason Dsouza e disponibilizado publicamente sob a licença do MIT.