此存储库包含 Jon Krohn 的机器学习基础课程附带的代码,该课程全面概述了构成当代机器学习方法(包括深度学习和其他人工智能)基础的所有学科(涵盖数学、统计学和计算机科学)技术。
课程中有八个科目,分为四个学科领域。请参阅下面的“机器学习之家”部分,详细了解为什么这些是重要的基础学科领域:
后面的科目以前面科目的内容为基础,因此建议的方法是按提供的顺序学习八个科目。也就是说,欢迎您根据您的兴趣或对材料的现有熟悉程度来选择各个主题。特别是,四个主题领域中的每一个都相当独立,因此可以分别进行处理。
八个ML 基础科目最初由 Jon Krohn 从 2020 年 5 月至 9 月在 O'Reilly 学习平台上作为实时在线培训提供(并从 2021 年 7 月至 12 月第二次提供;请参阅此处了解各个讲座日期)。
为了适合您喜欢的学习模式,现在可以通过多种渠道获取内容:
(请注意,虽然 YouTube 包含 100% 的教学内容,但付费选项(例如 Udemy、O'Reilly 和 ODSC)包含 YouTube 上不提供的练习的全面解决方案演练。一些付费选项还包括独有的、特定于平台的功能,例如交互式测试、“备忘单”以及成功完成课程颁发的证书。)
要随时了解未来的现场培训课程、新视频发布和书籍章节发布,请考虑通过 Jon Krohn 的主页订阅他的电子邮件通讯。
所有代码都在此目录中的 Jupyter 笔记本中提供。这些笔记本旨在在(免费)Colab 云环境中使用,这是当前唯一受到积极支持的环境。
也就是说,如果您熟悉在本地运行 Jupyter 笔记本,那么欢迎您这样做(请注意,此存储库的 Dockerfile 中的库版本不一定是最新的,但可能为在 Docker 容器中运行 Jupyter 提供合理的起点) 。
要成为一名出色的数据科学家或机器学习工程师,仅仅知道如何通过最流行的库(例如 scikit-learn、Keras)提供的抽象接口使用机器学习算法是不够的。为了训练创新模型或部署它们在生产中高效运行,对机器学习理论的深入理解(如图“机器学习之家”的中央紫色地板)可能会有所帮助或至关重要。而且,为了培养对机器学习的深入理解,人们必须对基础学科有有效的理解。
当“机器学习之家”的基础牢固时,从一般的 ML 原理(紫色层)跳转到专门的 ML 领域(顶层,以灰色显示),例如深度学习、自然语言处理、机器视觉和强化学习。这是因为,应用程序越专业,其实现细节就越有可能只能在学术论文或研究生水平的教科书中获得,而这两种教科书通常都假设人们了解基础学科。
如果满足以下条件,本系列中的内容可能与您特别相关:
近几十年来,基础学科基本上没有变化,并且在未来几十年可能仍然如此,但它们对于所有机器学习和数据科学方法都至关重要。因此,这些基础为整个职业生涯提供了坚实的基石。
本系列的目的是让您对所涵盖的内容有一个实用的、功能性的理解。每个主题都会给出上下文,突出其与机器学习的相关性。
与 Jon Krohn 创建的其他材料一样(例如《深度学习图解》一书和他的 18 小时视频系列《使用 TensorFlow、Keras 和 PyTorch 进行深度学习》) ,该系列中的内容通过以下内容的组合而变得栩栩如生:
编程:所有代码演示都将使用 Python,因此使用 Python 或其他面向对象编程语言的经验将有助于遵循代码示例。 Al Sweigart 的 Automate the Boring Stuff 是 Python 入门的一个很好的(而且免费的!)资源。
数学:熟悉中学水平的数学将使课程更容易跟上。如果您能够轻松处理定量信息(例如理解图表和重新排列简单方程),那么您应该做好充分准备来学习所有数学知识。如果您在学习机器学习基础课程时发现自己存在一些数学空白,我建议您使用免费的综合性可汗学院来填补这些空白。
最后,这是由出色的艺术家 Aglaé Bassens 创作的机器学习基金会吉祥物 Oboe 的插图: