这是 O'Reilly Publication 的官方代码存储库, 适用于云、移动和边缘的实用深度学习 作者:Anirudh Koul、Siddha Ganju 和 Meher Kasam。 **作为 Keras 官方网站上的学习资源** | ![]() |
---|
[Safari 在线] | [亚马逊购买] | [Google 图书在线] | [图书网站] | [幻灯片演示]
无论您是一位渴望进入深度学习世界的软件工程师、一位经验丰富的数据科学家,还是一位梦想着制作下一个病毒式人工智能应用程序的爱好者,您可能想知道我从哪里开始?本分步指南教您如何使用实践方法为云、移动设备、浏览器和边缘设备构建实用的深度学习应用程序。
Anirudh Koul、Siddha Ganju 和 Meher Kasam 凭借多年将深度学习研究转化为屡获殊荣的应用的行业经验,指导您完成将想法转化为现实世界中人们可以使用的东西的过程。
第 1 章 - 探索人工智能的前景|在线阅读 |人物
我们将带您了解从 20 世纪 50 年代至今不断演变的格局,分析构成完美深度学习配方的要素,熟悉常见的 AI 术语和数据集,并一窥负责任的 AI 世界。
第 2 章 - 图片内容:使用 Keras 进行图像分类|在线阅读 |人物
我们仅用五行 Keras 代码就深入研究了图像分类的世界。然后,我们通过在视频上叠加热图来了解神经网络在进行预测时关注的内容。额外奖励:我们听到了 Keras 的创建者François Chollet的激励人心的个人旅程,说明了一个人可以产生的影响。
第 3 章 - 猫与狗:使用 Keras 进行 30 行迁移学习|在线阅读 |人物
我们使用迁移学习在新的自定义分类任务中重用之前训练过的网络,以便在几分钟内获得接近最先进的准确性。然后,我们对结果进行切片和切块,以了解其分类效果如何。在此过程中,我们构建了一个通用的机器学习管道,并在整本书中对其进行了重新调整。额外奖励:我们听到 fast.ai 联合创始人Jeremy Howard讲述了数十万学生如何使用迁移学习来启动他们的 AI 之旅。
第 4 章 - 构建反向图像搜索引擎:理解嵌入|在线阅读 |人物
与谷歌反向图像搜索一样,我们探索如何使用嵌入(一种图像的上下文表示)在十行以内找到相似的图像。然后,当我们探索不同的策略和算法来大规模加速这一过程(从数千到数百万张图像)并使它们在微秒内可搜索时,乐趣就开始了。
第 5 章 - 从新手到预测大师:最大化卷积神经网络准确性|在线阅读 |人物
我们借助一系列工具(包括 TensorBoard、What-If Tool、tf-explain、TensorFlow Datasets、AutoKeras、AutoAugment)探索各种策略,以最大限度地提高分类器的准确性。在此过程中,我们进行实验,以直观地了解哪些参数可能或可能不适用于您的人工智能任务。
第 6 章 - 最大化 TensorFlow 的速度和性能:便捷的清单|在线阅读 |人物
我们通过检查包含 30 个技巧的清单,将训练和推理的速度带入超光速引擎,以尽可能减少效率低下的情况,并最大限度地提高当前硬件的价值。
第 7 章 - 实用工具、提示和技巧|在线阅读 |人物
我们将实践技能多样化到各种主题和工具,从安装、数据收集、实验管理、可视化、跟踪最新研究成果,一直到探索建立理论基础的进一步途径深度学习。
第 8 章 - 用于计算机视觉的云 API:15 分钟内启动并运行|在线阅读 |人物
聪明地工作,而不是努力地工作。我们在 15 分钟内利用了 Google、Microsoft、Amazon、IBM 和 Clarifai 的云 AI 平台的强大功能。对于现有 API 无法解决的任务,我们会使用自定义分类服务来训练分类器,而无需编码。然后我们让它们在公开基准测试中相互竞争,您可能会惊讶谁获胜。
第 9 章 - 使用 TensorFlow Serving 和 KubeFlow 在云上进行可扩展推理服务|在线阅读 |人物
我们将定制的训练模型带到云端/本地,以可扩展地服务从数千万到数百万的请求。我们探索 Flask、Google Cloud ML Engine、TensorFlow Serving 和 KubeFlow,展示工作量、场景和成本效益分析。
第 10 章 - 使用 TensorFlow.js 和 ml5.js 在浏览器中实现 AI |在线阅读 |人物
使用计算机或智能手机的每个人都可以统一访问一个软件程序——浏览器。通过基于浏览器的深度学习库(包括 TensorFlow.js 和 ml5.js)覆盖所有这些用户。客座作者Zaid Alyafeai向我们介绍了身体姿势估计、生成对抗网络 (GAN)、使用 Pix2Pix 进行图像到图像转换等技术和任务,这些技术和任务不是在服务器上运行,而是在浏览器本身中运行。额外奖励:聆听 TensorFlow.js 和 ml5.js 团队讲述项目如何孵化。
第 11 章 - 使用 Core ML 在 iOS 上进行实时对象分类|在线阅读 |人物
我们探索移动深度学习的前景,重点关注具有 Core ML 的 Apple 生态系统。我们在不同的 iPhone 上对模型进行基准测试,研究减少应用程序大小和能源影响的策略、动态模型部署、设备培训以及如何构建专业应用程序。
第 12 章 - 使用 Core ML 和 Create ML 在 iOS 上不是 Hotdog |在线阅读 |人物
硅谷的 Not Hotdog 应用程序(来自 HBO)被认为是移动人工智能的“Hello World”,因此我们通过以不是一种、不是两种而是三种不同的方式构建实时版本来表示敬意。
第 13 章 - Shazam for Food:使用 TensorFlow Lite 和 ML Kit 开发 Android 应用程序|在线阅读 |人物
我们借助 TensorFlow Lite 将人工智能引入 Android。然后,我们研究使用 ML Kit(基于 TensorFlow Lite 构建)和 Fritz 的跨平台开发,以探索构建自我改进的 AI 应用程序的端到端开发生命周期。在此过程中,我们关注模型版本控制、A/B 测试、衡量成功、动态更新、模型优化和其他主题。额外奖励:我们了解到Pete Warden (移动和嵌入式 TensorFlow 技术主管)在将 AI 引入边缘设备方面的丰富经验。
第 14 章 - 使用 TensorFlow 对象检测 API 构建 Purrfect Cat Locator 应用程序|在线阅读 |人物
我们探索了四种不同的方法来定位图像中对象的位置。我们回顾了多年来对象检测的演变,并分析了速度和准确性之间的权衡。这为人群计数、人脸检测和自动驾驶汽车等案例研究奠定了基础。
第 15 章 - 成为创客:探索边缘嵌入式人工智能|在线阅读 |人物
客座作者 Sam Sterckval 将深度学习引入低功耗设备,他展示了一系列具有不同处理能力和成本的支持 AI 的边缘设备,包括 Raspberry Pi、NVIDIA Jetson Nano、Google Coral、Intel Movidius、PYNQ-Z2 FPGA,机器人和创客项目的门。奖励:聆听NVIDIA Jetson Nano 团队讲述人们如何通过他们的开源食谱快速构建创意机器人。
第 16 章 - 使用 Keras 的端到端深度学习模拟自动驾驶汽车|在线阅读 |人物
客座作者Aditya Sharma和Mitchell Spryn使用 Microsoft AirSim 的逼真模拟环境,指导我们训练虚拟汽车,首先在环境中驾驶虚拟汽车,然后教 AI 模型复制其行为。一路上,本章涵盖了许多适用于自动驾驶汽车行业的概念。
第 17 章 - 一小时内构建自动驾驶汽车:使用 AWS DeepRacer 进行强化学习|在线阅读 |人物
从虚拟世界转向现实世界,客座作者Sunil Mallya展示了如何在一小时内组装、训练微型汽车 AWS DeepRacer 并进行比赛。在强化学习的帮助下,汽车学会自行驾驶,惩罚错误并最大化成功。我们学习如何将这些知识应用到从人工智能驾驶奥运会到 RoboRace(使用全尺寸自动驾驶汽车)的比赛中。额外奖励:聆听Anima Anandkumar (NVIDIA)和Chris Anderson(DIY Robocars 创始人)讲述自动驾驶汽车行业的发展方向。
首先,欢迎光临!我们很高兴您决定使用本书和代码来了解有关深度学习的更多信息!我们祝愿您在未来的旅程中一切顺利。以下是使用存储库时需要记住的一些事项。
code
文件夹中。请按照以下说明在 Google Colab 上加载 GitHub 存储库。请记住,您将需要访问自己的 Google 云端硬盘,因为我们将使用本地系统中的数据。
我们将在整本书中使用名为practicaldl
的virtualenv
。此virtualenv
的requirements.txt
位于根目录中。安装virtualenv
帮助和说明位于常见问题解答文档的安装部分。
请根据贡献提交问题,我们将进行调查。
@AnirudhKoul是一位著名的人工智能专家、UN/TEDx 演讲者和微软人工智能与研究中心的前科学家,他在微软人工智能与研究中心创立了 Seeing AI,该技术通常被认为是继 iPhone 之后盲人社区中最常用的技术。 Anirudh 担任 Aira 的人工智能与研究主管,被《时代》杂志评为 2018 年最佳发明之一。凭借向 10 亿用户提供的功能,他带来了十多年针对 PetaByte 规模数据集的面向生产的应用研究经验。他一直致力于使用人工智能技术开发增强现实、机器人、语音、生产力以及辅助功能等技术。他在 AI for Good 领域的工作被 IEEE 称为“改变生活”,获得了 CES、FCC、MIT、戛纳国际创意节、美国盲人理事会的奖项,并在联合国、世界经济论坛、白宫的活动中进行了展示、上议院、Netflix、国家地理,并受到贾斯汀·特鲁多和特蕾莎·梅等世界领导人的称赞。
@SiddhaGanju是一位 AI 研究员,曾入选福布斯 30 岁以下 30 岁以下人物名单,也是 Nvidia 的自动驾驶架构师。作为 NASA FDL 的人工智能顾问,她帮助 NASA 的 CAMS 项目建立了自动流星探测管道,最终发现了一颗彗星。此前,她在 Deep Vision 工作,为资源受限的边缘设备开发了深度学习模型。她的工作范围从视觉问答到生成对抗网络,再到从 CERN 的 PB 级数据中收集见解,并已在 CVPR 和 NeurIPS 等顶级会议上发表。她曾在包括 CES 在内的多项国际科技竞赛中担任特邀评委。作为技术多样性和包容性的倡导者,她在学校和大学发表演讲,以激励和发展来自各种背景的新一代技术。
@MeherKasam是一位经验丰富的软件开发人员,每天都有数千万用户使用应用程序。目前,他是 Square 的 iOS 开发人员,之前曾在 Microsoft 和 Amazon 工作过,他为一系列应用程序提供了功能,从 Square 的销售点到 Bing iPhone 应用程序。此前,他曾在微软工作,担任 Seeing AI 应用程序的移动开发主管,该应用程序获得了移动世界大会、CES、FCC 和美国盲人委员会等的广泛认可和奖项。他本质上是一名黑客,具有快速原型设计的天赋,他赢得了多次黑客马拉松,并将其转化为广泛使用的产品中提供的功能。他还担任全球移动奖和爱迪生奖等国际竞赛的评委。
如果您使用我们的代码,请引用我们。
@book{Koul2019PracticalDLBook,
title={Practical Deep Learning for Cloud, Mobile and Edge: Real-World AI and Computer Vision Projects Using Python, Keras and TensorFlow},
author={Koul, A. and Ganju, S. and Kasam, M.},
isbn={9781492034865},
url={https://www.oreilly.com/library/view/practical-deep-learning/9781492034858/},
year={2019},
publisher={O'Reilly Media, Incorporated}
}