Ceci est le référentiel de code officiel de la publication O'Reilly, Deep Learning pratique pour le cloud, le mobile et Edge par Anirudh Koul, Siddha Ganju et Meher Kasam. ** Présenté comme ressource d'apprentissage sur le site officiel de Keras ** |
---|
[En ligne sur Safari] | [Acheter sur Amazon] | [En ligne sur Google Livres] | [Site Web du livre] | [Présentation sur Slideshare]
Que vous soyez un ingénieur logiciel aspirant à entrer dans le monde de l'apprentissage profond, un data scientist chevronné ou un amateur rêvant simplement de créer la prochaine application virale d'IA, vous vous êtes peut-être demandé par où commencer ? Ce guide étape par étape vous apprend à créer des applications pratiques d'apprentissage en profondeur pour les appareils cloud, mobiles, navigateurs et Edge en utilisant une approche pratique.
S'appuyant sur des années d'expérience dans l'industrie dans la transformation de la recherche sur l'apprentissage profond en applications primées, Anirudh Koul, Siddha Ganju et Meher Kasam vous guident tout au long du processus de conversion d'une idée en quelque chose que les gens du monde réel peuvent utiliser.
Chapitre 1 - Explorer le paysage de l'intelligence artificielle | Lire en ligne | Chiffres
Nous faisons le tour de ce paysage en évolution, des années 1950 à nos jours, analysons les ingrédients qui constituent une recette parfaite d'apprentissage en profondeur, nous familiarisons avec la terminologie et les ensembles de données courants de l'IA, et jetons un coup d'œil dans le monde de l'IA responsable.
Chapitre 2 - Contenu de l'image : Classification d'images avec Keras | Lire en ligne | Chiffres
Nous plongeons dans le monde de la classification d'images en seulement cinq lignes de code Keras. Nous apprenons ensuite à quoi les réseaux de neurones prêtent attention tout en faisant des prédictions en superposant des cartes thermiques sur des vidéos. Bonus : on entend le parcours personnel motivant de François Chollet , le créateur de Keras, illustrant l'impact qu'un seul individu peut avoir.
Chapitre 3 - Chats contre chiens : transfert d'apprentissage en 30 lignes avec Keras | Lire en ligne | Chiffres
Nous utilisons l'apprentissage par transfert pour réutiliser un réseau précédemment formé sur une nouvelle tâche de classification personnalisée afin d'obtenir une précision proche de l'état de l'art en quelques minutes. Nous découpons ensuite les résultats pour comprendre dans quelle mesure ils sont classés. En cours de route, nous construisons un pipeline commun d’apprentissage automatique, qui est réutilisé tout au long du livre. Bonus : nous entendons Jeremy Howard , co-fondateur de fast.ai, expliquer comment des centaines de milliers d'étudiants utilisent l'apprentissage par transfert pour relancer leur parcours vers l'IA.
Chapitre 4 - Création d'un moteur de recherche d'images inversées : Comprendre les intégrations | Lire en ligne | Chiffres
À l'instar de Google Reverse Image Search, nous explorons comment utiliser les intégrations, une représentation contextuelle d'une image pour trouver des images similaires en moins de dix lignes. Et puis le plaisir commence lorsque nous explorons différentes stratégies et algorithmes pour accélérer cela à grande échelle, de plusieurs milliers à plusieurs millions d'images, et les rendre consultables en microsecondes.
Chapitre 5 - Du novice au maître prédicteur : maximiser la précision du réseau neuronal convolutif | Lire en ligne | Chiffres
Nous explorons des stratégies pour maximiser la précision que notre classificateur peut atteindre, à l'aide d'une gamme d'outils, notamment TensorBoard, What-If Tool, tf-explain, TensorFlow Datasets, AutoKeras, AutoAugment. En cours de route, nous menons des expériences pour développer une intuition des paramètres qui pourraient ou non fonctionner pour votre tâche d'IA.
Chapitre 6 - Maximiser la vitesse et les performances de TensorFlow : une liste de contrôle pratique | Lire en ligne | Chiffres
Nous prenons la vitesse de formation et d'inférence dans l'hyperdrive en passant en revue une liste de contrôle de 30 astuces pour réduire autant d'inefficacités que possible et maximiser la valeur de votre matériel actuel.
Chapitre 7 - Outils pratiques, trucs et astuces | Lire en ligne | Chiffres
Nous diversifions nos compétences pratiques dans une variété de sujets et d'outils, allant de l'installation, la collecte de données, la gestion d'expériences, les visualisations, le suivi de l'état de l'art en matière de recherche jusqu'à l'exploration de nouvelles voies pour construire les fondations théoriques. d’apprentissage profond.
Chapitre 8 - API Cloud pour la vision par ordinateur : opérationnelles en 15 minutes | Lire en ligne | Chiffres
Travaillez intelligemment, pas dur. Nous utilisons la puissance des plateformes d'IA cloud de Google, Microsoft, Amazon, IBM et Clarifai en moins de 15 minutes. Pour les tâches non résolues avec les API existantes, nous utilisons ensuite des services de classification personnalisés pour former les classificateurs sans codage. Et puis nous les opposons dans un benchmark ouvert, vous pourriez être surpris de savoir qui a gagné.
Chapitre 9 - Service d'inférence évolutif sur le cloud avec TensorFlow Serving et KubeFlow | Lire en ligne | Chiffres
Nous transférons notre modèle personnalisé formé vers le cloud/sur site pour répondre de manière évolutive à des dizaines, voire des millions de requêtes. Nous explorons Flask, Google Cloud ML Engine, TensorFlow Serving et KubeFlow, en présentant l'effort, le scénario et l'analyse coûts-avantages.
Chapitre 10 : IA dans le navigateur avec TensorFlow.js et ml5.js | Lire en ligne | Chiffres
Chaque individu qui utilise un ordinateur ou un smartphone a uniformément accès à un seul logiciel : son navigateur. Atteignez tous ces utilisateurs avec des bibliothèques d'apprentissage profond basées sur un navigateur, notamment TensorFlow.js et ml5.js. L'auteur invité Zaid Alyafeai nous guide à travers des techniques et des tâches telles que l'estimation de la posture du corps, les réseaux contradictoires génératifs (GAN), la traduction d'image à image avec Pix2Pix et bien plus encore, fonctionnant non pas sur un serveur mais dans le navigateur lui-même. Bonus : écoutez les équipes TensorFlow.js et ml5.js expliquer comment les projets ont été incubés.
Chapitre 11 - Classification d'objets en temps réel sur iOS avec Core ML | Lire en ligne | Chiffres
Nous explorons le paysage du deep learning sur mobile, en mettant l'accent sur l'écosystème Apple avec Core ML. Nous comparons des modèles sur différents iPhones, étudions des stratégies pour réduire la taille des applications et leur impact énergétique, le déploiement de modèles dynamiques, la formation sur l'appareil et la manière dont les applications professionnelles sont créées.
Chapitre 12 – Pas Hotdog sur iOS avec Core ML et Create ML | Lire en ligne | Chiffres
L'application Not Hotdog de la Silicon Valley (de HBO) est considérée comme le « Hello World » de l'IA mobile. Nous lui rendons donc hommage en créant une version en temps réel non pas d'une, ni de deux, mais de trois manières différentes.
Chapitre 13 - Shazam for Food : Développement d'applications Android avec TensorFlow Lite et ML Kit | Lire en ligne | Chiffres
Nous apportons l'IA à Android avec l'aide de TensorFlow Lite. Nous examinons ensuite le développement multiplateforme à l'aide de ML Kit (qui repose sur TensorFlow Lite) et de Fritz pour explorer le cycle de vie de développement de bout en bout pour créer une application d'IA auto-améliorée. En cours de route, nous examinons la gestion des versions des modèles, les tests A/B, la mesure du succès, les mises à jour dynamiques, l'optimisation des modèles et d'autres sujets. Bonus : nous entendons parler de la riche expérience de Pete Warden (responsable technique pour TensorFlow mobile et intégré) dans l'intégration de l'IA aux appareils de pointe.
Chapitre 14 - Création de l'application Purrfect Cat Locator avec l'API de détection d'objets TensorFlow | Lire en ligne | Chiffres
Nous explorons quatre méthodes différentes pour localiser la position des objets dans les images. Nous examinons l'évolution de la détection d'objets au fil des années et analysons les compromis entre vitesse et précision. Cela constitue la base d’études de cas telles que le comptage de foule, la détection de visages et les voitures autonomes.
Chapitre 15 - Devenir un créateur : explorer l'IA embarquée à la périphérie | Lire en ligne | Chiffres
L'auteur invité Sam Sterckval apporte l'apprentissage approfondi aux appareils à faible consommation en présentant une gamme d'appareils de pointe compatibles avec l'IA avec une puissance de traitement et un coût variables, notamment Raspberry Pi, NVIDIA Jetson Nano, Google Coral, Intel Movidius, PYNQ-Z2 FPGA, ouvrant ainsi le portes pour projets de robotique et de maker. Bonus : écoutez l' équipe NVIDIA Jetson Nano expliquer comment les gens construisent rapidement des robots créatifs à partir de leur livre de recettes open source.
Chapitre 16 - Simuler une voiture autonome à l'aide du Deep Learning de bout en bout avec Keras | Lire en ligne | Chiffres
À l'aide de l'environnement de simulation photoréaliste de Microsoft AirSim, les auteurs invités Aditya Sharma et Mitchell Spryn nous guident dans la formation d'une voiture virtuelle en la conduisant d'abord dans l'environnement, puis en enseignant à un modèle d'IA pour reproduire son comportement. En cours de route, ce chapitre couvre un certain nombre de concepts applicables dans l'industrie automobile autonome.
Chapitre 17 - Construire une voiture autonome en moins d'une heure : apprentissage par renforcement avec AWS DeepRacer | Lire en ligne | Chiffres
Passant du monde virtuel au monde physique, l'auteur invité Sunil Mallya montre comment AWS DeepRacer, une voiture miniature, peut être assemblée, entraînée et pilotée en moins d'une heure. Et grâce à l’apprentissage par renforcement, la voiture apprend à conduire seule, pénalisant les erreurs et maximisant le succès. Nous apprenons comment appliquer ces connaissances aux courses, depuis les Jeux olympiques de conduite IA jusqu'à RoboRace (utilisant des voitures autonomes pleine grandeur). Bonus : écoutez Anima Anandkumar (NVIDIA) et Chris Anderson (fondateur de DIY Robocars) expliquer où se dirige l'industrie automobile autonome.
Tout d’abord, bienvenue ! Nous sommes heureux que vous ayez décidé d'utiliser le livre et le code pour en savoir plus sur le Deep Learning ! Nous vous souhaitons le meilleur pour votre voyage à venir. Voici quelques éléments à garder à l’esprit lors de l’utilisation du référentiel.
code
.Veuillez suivre ces instructions pour charger le dépôt GitHub sur Google Colab. Gardez à l'esprit que vous aurez besoin d'accéder à votre propre Google Drive car nous utiliserons les données d'un système local.
Nous utiliserons un virtualenv
du nom de practicaldl
tout au long du livre. Le requirements.txt
de ce virtualenv
se trouve dans le répertoire racine. L'aide et les instructions pour installer virtualenv
se trouvent dans la section Installation du document FAQ.
Veuillez déposer un problème selon CONTRIBUTION et nous enquêterons.
@AnirudhKoul est un expert reconnu en IA, conférencier UN/TEDx et ancien scientifique chez Microsoft AI & Research, où il a fondé Seeing AI, souvent considérée comme la technologie la plus utilisée par la communauté aveugle après l'iPhone. Anirudh est responsable de l'IA et de la recherche chez Aira, reconnu par Time Magazine comme l'une des meilleures inventions de 2018. Avec des fonctionnalités livrées à un milliard d'utilisateurs, il apporte plus d'une décennie d'expérience en recherche appliquée orientée production sur des ensembles de données à l'échelle du pétaoctet. Il a développé des technologies utilisant des techniques d'IA pour la réalité augmentée, la robotique, la parole, la productivité ainsi que l'accessibilité. Son travail dans le domaine de l'IA pour le bien, que l'IEEE a qualifié de « changeant la vie », a reçu des prix du CES, de la FCC, du MIT, des Cannes Lions, de l'American Council of the Blind, et a été présenté lors d'événements organisés par l'ONU, le Forum économique mondial et la Maison Blanche. , Chambre des Lords, Netflix, National Geographic, et salué par des dirigeants mondiaux, dont Justin Trudeau et Theresa May.
@SiddhaGanju , un chercheur en IA que Forbes figurait dans sa liste des 30 moins de 30 ans, est un architecte autonome chez Nvidia. En tant que conseillère en IA auprès de la NASA FDL, elle a aidé à construire un pipeline automatisé de détection de météores pour le projet CAMS de la NASA, qui a fini par découvrir une comète. Auparavant chez Deep Vision, elle a développé des modèles d'apprentissage profond pour les appareils de pointe à contraintes de ressources. Son travail va de la réponse visuelle aux questions aux réseaux contradictoires génératifs en passant par la collecte d'informations à partir des données à l'échelle du pétaoctet du CERN et a été publié lors de conférences de premier plan, notamment CVPR et NeurIPS. Elle a été membre du jury de plusieurs concours technologiques internationaux, dont le CES. En tant que défenseure de la diversité et de l'inclusion dans la technologie, elle s'exprime dans les écoles et les collèges pour motiver et développer une nouvelle génération de technologies de tous horizons.
@MeherKasam est un développeur de logiciels chevronné dont les applications sont utilisées chaque jour par des dizaines de millions d'utilisateurs. Actuellement développeur iOS chez Square et ayant déjà travaillé chez Microsoft et Amazon, il a fourni des fonctionnalités pour une gamme d'applications allant du point de vente de Square à l'application iPhone de Bing. Auparavant, il a travaillé chez Microsoft, où il était responsable du développement mobile de l'application Seeing AI, qui a reçu une large reconnaissance et des récompenses du Mobile World Congress, du CES, de la FCC et de l'American Council of the Blind, pour n'en nommer que quelques-uns. Hacker dans l'âme avec un talent pour le prototypage rapide, il a remporté plusieurs hackathons et les a convertis en fonctionnalités intégrées à des produits largement utilisés. Il est également juge lors de concours internationaux, notamment les Global Mobile Awards et les Edison Awards.
Merci de nous citer si vous utilisez notre code.
@book{Koul2019PracticalDLBook,
title={Practical Deep Learning for Cloud, Mobile and Edge: Real-World AI and Computer Vision Projects Using Python, Keras and TensorFlow},
author={Koul, A. and Ganju, S. and Kasam, M.},
isbn={9781492034865},
url={https://www.oreilly.com/library/view/practical-deep-learning/9781492034858/},
year={2019},
publisher={O'Reilly Media, Incorporated}
}