Una persona que trabaja en el campo de la IA y no sabe matemáticas es como un político que no sabe cómo persuadir. ¡Ambos tienen un área ineludible en la que trabajar!
Hace una semana, escribí un artículo sobre Cómo ingresar a la ciencia de datos en 2021 y desde entonces he recibido varios correos electrónicos de personas de todo el mundo preguntando cuántas matemáticas se requieren en la ciencia de datos.
No mentiré: son muchas matemáticas .
Y esta es una de las razones que desanima a muchos principiantes. Después de mucha investigación y conversaciones con varios veteranos en el campo, he compilado esta guía sensata que cubre todos los fundamentos de las matemáticas que necesitará saber . Los conceptos que se mencionan a continuación generalmente se cubren durante varios semestres en la universidad, pero los he reducido a los principios básicos en los que puedes concentrarte.
Esta guía es un verdadero salvavidas para los principiantes, para que puedan estudiar los temas más importantes y un recurso aún mejor para profesionales como yo que requieren un rápido aprendizaje de estos conceptos.
Nota : No es necesario que conozca todos los conceptos (a continuación) para conseguir su primer trabajo en ciencia de datos. Todo lo que necesitas es una comprensión firme de los fundamentos. Concéntrate en ellos y consolidalos.
El conocimiento de álgebra es quizás fundamental para las matemáticas en general. Además de operaciones matemáticas como suma, resta, multiplicación y división, necesitarás saber lo siguiente:
Exponentes
Radicales
factoriales
Sumaciones
Notaciones científicas
El álgebra lineal es la principal herramienta de cálculo matemático en la Inteligencia Artificial y en muchas áreas de la Ciencia y la Ingeniería. En esto, es necesario comprender cuatro objetos matemáticos principales y sus propiedades:
Escalares: un solo número (puede ser real o natural).
Vectores: una lista de números, ordenados en orden. Considérelos como puntos en el espacio y cada elemento representa la coordenada a lo largo de un eje.
Matrices: una matriz bidimensional de números donde cada número se identifica mediante 2 índices.
Tensores: una matriz ND de números (N>2), dispuesta en una cuadrícula regular con N-ejes. Importante en aprendizaje automático, aprendizaje profundo y visión por computadora
Vectores propios y valores propios: vectores especiales y su cantidad escalar correspondiente. Comprenda el significado y cómo encontrarlos.
Descomposición de valores singulares: factorización de una matriz en 3 matrices. Comprender las propiedades y aplicaciones.
Análisis de componentes principales (PCA): comprenda el significado, las propiedades y las aplicaciones.
También es útil conocer propiedades como el producto escalar, el producto vectorial y el producto Hadamard.
El cálculo se ocupa de cambios en parámetros, funciones, errores y aproximaciones. El conocimiento práctico del cálculo multidimensional es imperativo en la ciencia de datos. Los siguientes son los conceptos más importantes (aunque no exhaustivos) en Cálculo:
Derivadas: reglas (suma, producto, regla de la cadena, etc.), derivadas hiperbólicas (tanh, cosh, etc.) y derivadas parciales.
Cálculo vectorial/matriz: diferentes operadores derivados (degradado, jacobiano, hessiano y laplaciano)
Algoritmos de gradiente: máximos y mínimos locales/globales, puntos de silla, funciones convexas, lotes y minilotes, descenso de gradiente estocástico y comparación de rendimiento.
Estadísticas básicas: media, mediana, moda, varianza, covarianza, etc.
Reglas básicas de probabilidad: eventos (dependientes e independientes), espacios muestrales, probabilidad condicional.
Variables aleatorias: continuas y discretas, expectativa, varianza, distribuciones (conjuntas y condicionales).
Teorema de Bayes: calcula la validez de las creencias. El software bayesiano ayuda a las máquinas a reconocer patrones y tomar decisiones.
Estimación de máxima verosimilitud (MLE): estimación de parámetros. Requiere conocimiento de conceptos fundamentales de probabilidad (probabilidad conjunta e independencia de eventos).
Distribuciones comunes: binomial, poisson, bernoulli, gaussiana, exponencial.
Un campo importante que ha realizado importantes contribuciones a la IA y el aprendizaje profundo y que aún es desconocido para muchos. Puede considerarse como una combinación de cálculo, estadística y probabilidad.
Entropía: también llamada entropía de Shannon. Se utiliza para medir la incertidumbre de en un experimento.
Entropía cruzada: compara dos distribuciones de probabilidad y nos dice qué tan similares son.
Divergencia de Kullback Leibler: otra medida de cuán similares son dos distribuciones de probabilidad.
Algoritmo de Viterbi: ampliamente utilizado en el procesamiento del lenguaje natural (PLN) y el habla
Codificador-Decodificador: utilizado en RNN de traducción automática y otros modelos.
En Inteligencia Artificial las matemáticas son muy importantes. Sin él, es comparable a un cuerpo humano sin alma. Puedes tratar los conceptos matemáticos como un sistema de pago por uso: cada vez que aparezca un concepto extraño, ¡cógelo y devoralo! La guía anterior presenta un recurso mínimo, pero completo, para comprender cualquier tipo de tema o concepto en IA.
¡Buena suerte!
Si cree que esta hoja de ruta se puede mejorar, abra un PR con cualquier actualización y envíe cualquier problema. Continuaremos mejorando esto, por lo que es posible que desees considerar ver o destacar este repositorio para volver a visitarlo en el futuro.
Eche un vistazo a la guía de contribución para saber cómo actualizar la hoja de ruta.
Abrir una solicitud de extracción con mejoras
Discutir ideas en temas.
corre la voz
Comuníquese con cualquier comentario
Esta hoja de ruta fue creada por Jason Dsouza y puesta a disposición del público bajo la licencia MIT.