一个不懂数学的人工智能领域的人就像一个不懂得如何说服的政客。两者都有一个不可避免的工作领域!
一周前,我写了一篇关于 2021 年如何进入数据科学的文章,从那时起,我收到了来自世界各地的几封电子邮件,询问数据科学需要多少数学知识。
我不会撒谎:这涉及很多数学知识。
这也是许多初学者望而却步的原因之一。经过大量研究并与该领域的几位资深人士交谈后,我编写了这份严肃的指南,其中涵盖了您需要了解的所有数学基础知识。下面提到的概念通常会在大学的几个学期中涵盖,但我已将它们归结为您可以关注的核心原则。
对于初学者来说,本指南绝对是救星,因此您可以学习最重要的主题,对于像我这样需要快速了解这些概念的从业者来说,这也是更好的资源。
注意:您不需要了解所有概念(如下)才能获得数据科学领域的第一份工作。您所需要的只是牢牢掌握基础知识。专注于这些并巩固它们。
一般来说,代数知识也许是数学的基础。除了加法、减法、乘法和除法等数学运算之外,您还需要了解以下内容:
指数
激进派
阶乘
总结
科学记数法
线性代数是人工智能和许多科学与工程领域的主要数学计算工具。在此,需要理解 4 个主要数学对象及其属性:
标量 - 单个数字(可以是实数或自然数)。
向量 - 按顺序排列的数字列表。将它们视为空间中的点,每个元素代表沿轴的坐标。
矩阵 - 二维数字数组,其中每个数字由 2 个索引标识。
张量 - ND 数字数组 (N>2),排列在具有 N 轴的规则网格上。在机器学习、深度学习和计算机视觉中很重要
特征向量和特征值 - 特殊向量及其相应的标量。了解其重要性以及如何找到它们。
奇异值分解 - 将一个矩阵分解为 3 个矩阵。了解特性和应用。
主成分分析 (PCA) - 了解其意义、性质和应用。
了解点积、矢量积和哈达玛积等属性也很有用。
微积分处理参数、函数、误差和近似值的变化。多维微积分的应用知识在数据科学中是必不可少的。以下是微积分中最重要的概念(尽管并非详尽无遗):
导数 - 规则(加法、乘积、链式法则等)、双曲导数(tanh、cosh 等)和偏导数。
向量/矩阵微积分 - 不同的导数算子(梯度、雅可比、海森和拉普拉斯)
梯度算法 - 局部/全局最大值和最小值、鞍点、凸函数、批量和小批量、随机梯度下降和性能比较。
基本统计 - 均值、中位数、众数、方差、协方差等
概率的基本规则 - 事件(相关和独立)、样本空间、条件概率。
随机变量 - 连续和离散、期望、方差、分布(联合和条件)。
贝叶斯定理 - 计算信念的有效性。贝叶斯软件帮助机器识别模式并做出决策。
最大似然估计 (MLE) - 参数估计。需要了解基本概率概念(联合概率和事件独立性)。
常见分布 - 二项分布、泊松分布、伯努利分布、高斯分布、指数分布。
这是一个对人工智能和深度学习做出了重大贡献的重要领域,但许多人还不知道。它可以被认为是微积分、统计学和概率的结合。
熵 - 也称为香农熵。用于测量实验中的不确定性。
交叉熵 - 比较两个概率分布并告诉我们它们有多相似。
Kullback Leibler 散度 - 两个概率分布相似程度的另一种度量。
维特比算法 - 广泛应用于自然语言处理 (NLP) 和语音
编码器-解码器 - 用于机器翻译 RNN 和其他模型。
在人工智能中,数学非常重要。没有它,就相当于没有灵魂的人体。你可以将数学概念视为现收现付:每当出现一个外来概念时,抓住它并吞噬它!上面的指南提供了一个最小但全面的资源来理解人工智能中的任何类型的主题或概念。
祝你好运!
如果您认为此路线图可以改进,请提交包含任何更新的 PR 并提交任何问题。我们将继续改进这一点,因此您可能需要考虑观看/加注星标此存储库以便将来重新访问它。
查看贡献指南以了解如何更新路线图。
打开带有改进的拉取请求
讨论问题中的想法
传播这个词
如有任何反馈请联系我们
该路线图由 Jason Dsouza 创建,并根据 MIT 许可证公开发布。