Это официальный репозиторий кода публикации O'Reilly. Практическое глубокое обучение для облачных, мобильных и периферийных устройств Анирудх Коул, Сиддха Ганджу и Мехер Касам. ** Представлено как обучающий ресурс на официальном сайте Keras ** |
---|
[Онлайн в Safari] | [Купить на Amazon] | [Онлайн в Google Книгах] | [Сайт книги] | [Презентация на Slideshare]
Являетесь ли вы инженером-программистом, стремящимся войти в мир глубокого обучения, опытным специалистом по обработке данных или любителем с простой мечтой создать следующее вирусное приложение с искусственным интеллектом, вы, возможно, задаетесь вопросом, с чего мне начать? Это пошаговое руководство научит вас, как создавать практические приложения глубокого обучения для облака, мобильных устройств, браузеров и периферийных устройств, используя практический подход.
Опираясь на многолетний отраслевой опыт преобразования исследований глубокого обучения в отмеченные наградами приложения, Анируд Коул, Сиддха Ганджу и Мехер Касам проведут вас через процесс преобразования идеи в нечто, что люди в реальном мире могут использовать.
Глава 1. Исследование возможностей искусственного интеллекта | Читать онлайн | Цифры
Мы совершим экскурсию по этому развивающемуся ландшафту, с 1950-х годов по сегодняшний день, и проанализируем ингредиенты, составляющие идеальный рецепт глубокого обучения, познакомимся с общей терминологией и наборами данных в области ИИ, а также заглянем в мир ответственного ИИ.
Глава 2. Что на картинке: классификация изображений с помощью Keras | Читать онлайн | Цифры
Мы погружаемся в мир классификации изображений всего лишь с помощью пяти строк кода Keras. Затем мы узнаем, на что обращают внимание нейронные сети при составлении прогнозов, накладывая тепловые карты на видео. Бонус: мы слышим мотивирующее личное путешествие Франсуа Шолле , создателя Keras, иллюстрирующее влияние, которое может оказать один человек.
Глава 3 — Кошки против собак: трансферное обучение в 30 строках с Keras | Читать онлайн | Цифры
Мы используем трансферное обучение, чтобы повторно использовать ранее обученную сеть для новой пользовательской задачи классификации, чтобы за считанные минуты достичь высочайшей точности. Затем мы анализируем результаты, чтобы понять, насколько хорошо они классифицируются. Попутно мы создаем общий конвейер машинного обучения, назначение которого меняется на протяжении всей книги. Бонус: мы узнаем от Джереми Ховарда , соучредителя fast.ai, о том, как сотни тысяч студентов используют трансферное обучение, чтобы начать свое путешествие в области искусственного интеллекта.
Глава 4. Создание поисковой системы с обратным изображением: понимание вложений | Читать онлайн | Цифры
Как и в Google Reverse Image Search, мы исследуем, как можно использовать встраивания — контекстное представление изображения для поиска похожих изображений менее чем в десяти строках. А затем начинается самое интересное, когда мы исследуем различные стратегии и алгоритмы, позволяющие ускорить процесс в масштабе, от тысяч до нескольких миллионов изображений, и сделать их доступными для поиска за микросекунды.
Глава 5 - От новичка до мастера-предсказателя: максимизация точности сверточной нейронной сети | Читать онлайн | Цифры
Мы изучаем стратегии, позволяющие максимизировать точность, которую может достичь наш классификатор, с помощью ряда инструментов, включая TensorBoard, What-If Tool, tf-explain, наборы данных TensorFlow, AutoKeras, AutoAugment. Попутно мы проводим эксперименты, чтобы понять, какие параметры могут или не могут работать для вашей задачи ИИ.
Глава 6. Максимизация скорости и производительности TensorFlow: удобный контрольный список | Читать онлайн | Цифры
Мы используем скорость обучения и вывода в Hyperdrive, пройдя контрольный список из 30 приемов, чтобы уменьшить как можно больше неэффективности и максимизировать ценность вашего текущего оборудования.
Глава 7. Практические инструменты, советы и рекомендации | Читать онлайн | Цифры
Мы диверсифицируем наши практические навыки по различным темам и инструментам, начиная от установки, сбора данных, управления экспериментами, визуализации, отслеживания последних достижений в исследованиях и заканчивая изучением дальнейших путей построения теоретической основы. глубокого обучения.
Глава 8. Облачные API для компьютерного зрения: запуск и запуск за 15 минут | Читать онлайн | Цифры
Работайте разумно, а не усердно. Мы используем возможности облачных платформ искусственного интеллекта от Google, Microsoft, Amazon, IBM и Clarifai менее чем за 15 минут. Для задач, которые не решаются с помощью существующих API, мы затем используем специальные службы классификации для обучения классификаторов без написания кода. А затем мы противопоставляем их друг другу в открытом тесте, вы можете быть удивлены, кто победил.
Глава 9. Масштабируемое обслуживание вывода в облаке с помощью TensorFlow Serving и KubeFlow | Читать онлайн | Цифры
Мы переносим нашу специально обученную модель в облако или локальную среду для масштабируемого обслуживания от десятков до миллионов запросов. Мы исследуем Flask, Google Cloud ML Engine, TensorFlow Serving и KubeFlow, демонстрируя усилия, сценарии и анализ затрат и выгод.
Глава 10. Искусственный интеллект в браузере с помощью TensorFlow.js и ml5.js | Читать онлайн | Цифры
Каждый человек, использующий компьютер или смартфон, имеет доступ к одной программе — своему браузеру. Охватите всех этих пользователей с помощью браузерных библиотек глубокого обучения, включая TensorFlow.js и ml5.js. Приглашенный автор Заид Аляфеай знакомит нас с методами и задачами, такими как оценка позы тела, генеративно-состязательные сети (GAN), преобразование изображений в изображения с помощью Pix2Pix и многое другое, работающее не на сервере, а в самом браузере. Бонус: узнайте от команд TensorFlow.js и ml5.js о том, как развивались проекты.
Глава 11. Классификация объектов в реальном времени в iOS с помощью Core ML | Читать онлайн | Цифры
Мы изучаем возможности глубокого обучения на мобильных устройствах, уделяя особое внимание экосистеме Apple с помощью Core ML. Мы тестируем модели на разных iPhone, исследуем стратегии по уменьшению размера приложений и энергопотребления, динамическое развертывание моделей, обучение на устройствах и способы создания профессиональных приложений.
Глава 12. Не Hotdog на iOS с Core ML и Create ML | Читать онлайн | Цифры
Приложение Not Hotdog из Кремниевой долины (от HBO) считается «Привет, мир» мобильного ИИ, поэтому мы отдаем должное, создавая версию в реальном времени не одним, не двумя, а тремя разными способами.
Глава 13. Shazam for Food: разработка приложений для Android с помощью TensorFlow Lite и ML Kit | Читать онлайн | Цифры
Мы внедряем искусственный интеллект в Android с помощью TensorFlow Lite. Затем мы рассмотрим кроссплатформенную разработку с использованием ML Kit (который создан на основе TensorFlow Lite) и Fritz, чтобы изучить сквозной жизненный цикл разработки для создания самоусовершенствующегося приложения AI. Попутно мы рассматриваем управление версиями моделей, A/B-тестирование, измерение успеха, динамические обновления, оптимизацию моделей и другие темы. Бонус: мы узнаем о богатом опыте Пита Уордена (технического руководителя Mobile and Embedded TensorFlow) в области внедрения ИИ на периферийных устройствах.
Глава 14. Создание приложения Purrfect Cat Locator с API обнаружения объектов TensorFlow | Читать онлайн | Цифры
Мы исследуем четыре различных метода определения положения объектов на изображениях. Мы рассмотрим эволюцию обнаружения объектов на протяжении многих лет и анализируем компромисс между скоростью и точностью. Это создает основу для тематических исследований, таких как подсчет толпы, распознавание лиц и беспилотные автомобили.
Глава 15. Стать творцом: исследование встроенного ИИ на периферии | Читать онлайн | Цифры
Приглашенный автор Сэм Стерквал привносит глубокое изучение маломощных устройств, демонстрируя ряд периферийных устройств с поддержкой искусственного интеллекта различной вычислительной мощности и стоимости, включая Raspberry Pi, NVIDIA Jetson Nano, Google Coral, Intel Movidius, PYNQ-Z2 FPGA, открывая двери для робототехники и конструкторских проектов. Бонус: узнайте от команды NVIDIA Jetson Nano о том, как люди быстро создают креативных роботов, используя свою книгу рецептов с открытым исходным кодом.
Глава 16. Моделирование беспилотного автомобиля с использованием сквозного глубокого обучения с помощью Keras | Читать онлайн | Цифры
Используя среду фотореалистичного моделирования Microsoft AirSim, приглашенные авторы Адитья Шарма и Митчелл Сприн помогают нам обучать виртуальный автомобиль, сначала управляя им в окружающей среде, а затем обучая модель искусственного интеллекта воспроизводить его поведение. Попутно в этой главе рассматривается ряд концепций, применимых в индустрии беспилотных автомобилей.
Глава 17. Создание автономного автомобиля менее чем за час: обучение с подкреплением с помощью AWS DeepRacer | Читать онлайн | Цифры
Переходя из виртуального мира в физический, приглашенный автор Сунил Малья демонстрирует, как миниатюрный автомобиль AWS DeepRacer можно собрать, обучить и участвовать в гонках менее чем за час. А с помощью обучения с подкреплением автомобиль учится ездить самостоятельно, наказывая за ошибки и максимизируя успех. Мы учимся применять эти знания в гонках — от Олимпийских игр по вождению с использованием искусственного интеллекта до RoboRace (с использованием полноразмерных автономных автомобилей). Бонус: узнайте от Анимы Анандкумар (NVIDIA) и Криса Андерсона (основателя DIY Robocars) о том, в каком направлении движется индустрия беспилотных автомобилей.
Прежде всего, добро пожаловать! Мы рады, что вы решили использовать книгу и код, чтобы узнать больше о глубоком обучении! Мы желаем вам всего наилучшего в вашем путешествии вперед. Вот несколько вещей, которые следует учитывать при использовании репозитория.
code
.Следуйте этим инструкциям, чтобы загрузить репозиторий GitHub в Google Colab. Имейте в виду, что вам понадобится доступ к вашему собственному Google Диску, поскольку мы будем использовать данные из локальной системы.
На протяжении всей книги мы будем использовать virtualenv
под названием practicaldl
. requirements.txt
для этого virtualenv
находится в корневом каталоге. Помощь и инструкции по установке virtualenv
находятся в разделе «Установка» документа «Часто задаваемые вопросы».
Пожалуйста, сообщите о проблеме в соответствии с CONTRIBUTING, и мы проведем расследование.
@AnirudhKoul — известный эксперт по искусственному интеллекту, спикер ООН/TEDx и бывший учёный из Microsoft AI & Research, где он основал компанию Seeing AI, которая часто считается наиболее используемой технологией среди слепых после iPhone. Анируд является главой отдела искусственного интеллекта и исследований в компании Aira, признанной журналом Time Magazine одним из лучших изобретений 2018 года. Благодаря функциям, предоставленным миллиарду пользователей, он имеет более чем десятилетний опыт прикладных исследований, ориентированных на производство, с наборами данных масштаба PetaByte. Он занимается разработкой технологий с использованием методов искусственного интеллекта для дополненной реальности, робототехники, речи, производительности, а также доступности. Его работа в области искусственного интеллекта во благо, которую IEEE назвал «изменяющей жизнь», получила награды от CES, FCC, MIT, Каннских львов, Американского совета слепых, демонстрировалась на мероприятиях ООН, Всемирного экономического форума, Белого дома. , Палата лордов, Netflix, National Geographic, а также хвалят мировые лидеры, включая Джастина Трюдо и Терезу Мэй.
@SiddhaGanju , исследователь искусственного интеллекта, которого Forbes включил в список «30 до 30», является архитектором беспилотных автомобилей в Nvidia. В качестве советника по искусственному интеллекту в NASA FDL она помогла построить конвейер автоматического обнаружения метеоров для проекта CAMS в НАСА, в результате которого была обнаружена комета. Ранее в Deep Vision она разрабатывала модели глубокого обучения для периферийных устройств с ограниченными ресурсами. Ее работа варьируется от визуальных ответов на вопросы до генеративно-состязательных сетей и сбора информации из петабайтных данных CERN. Ее работы публиковались на конференциях высшего уровня, включая CVPR и NeurIPS. Она была членом жюри нескольких международных технологических конкурсов, включая CES. Будучи сторонницей разнообразия и инклюзивности в технологиях, она выступает в школах и колледжах, чтобы мотивировать и развивать новое поколение технологий из всех слоев общества.
@MeherKasam — опытный разработчик программного обеспечения, приложениями которого ежедневно пользуются десятки миллионов пользователей. В настоящее время он является разработчиком iOS в Square, а ранее работал в Microsoft и Amazon. Он предоставил функции для ряда приложений, от Square Point of Sale до приложения Bing для iPhone. Ранее он работал в Microsoft, где возглавлял мобильную разработку приложения Seeing AI, которое получило широкое признание и награды от Mobile World Congress, CES, FCC и Американского совета слепых и многих других. Хакер в душе, обладающий талантом к быстрому прототипированию, он выиграл несколько хакатонов и преобразовал их в функции, включенные в широко используемые продукты. Он также является судьей международных конкурсов, включая Global Mobile Awards и Edison Awards.
Пожалуйста, укажите нас, если вы используете наш код.
@book{Koul2019PracticalDLBook,
title={Practical Deep Learning for Cloud, Mobile and Edge: Real-World AI and Computer Vision Projects Using Python, Keras and TensorFlow},
author={Koul, A. and Ganju, S. and Kasam, M.},
isbn={9781492034865},
url={https://www.oreilly.com/library/view/practical-deep-learning/9781492034858/},
year={2019},
publisher={O'Reilly Media, Incorporated}
}