これは、O'Reilly Publication の公式コード リポジトリです。 クラウド、モバイル、エッジ向けの実践的なディープラーニング アニルダ・コール、シッダ・ガンジュ、メヘル・カサム著。 ** Keras の公式 Web サイトで学習リソースとして紹介されています** |
---|
[Safariでオンライン] | 【Amazonで購入】 | [Google ブックスでオンライン] | 【書籍サイト】 | 【スライドシェアでのプレゼンテーション】
あなたがディープラーニングの世界に参入したいと考えているソフトウェア エンジニアであっても、ベテランのデータ サイエンティストであっても、次のバイラル AI アプリを作るという単純な夢を持つ愛好家であっても、どこから始めればよいのか疑問に思ったことがあるかもしれません。このステップバイステップのガイドでは、実践的なアプローチを使用して、クラウド、モバイル、ブラウザー、エッジ デバイス向けの実用的なディープ ラーニング アプリケーションを構築する方法を説明します。
Anirudh Koul、Siddha Ganju、Meher Kasam は、深層学習の研究を受賞歴のあるアプリケーションに変換した長年の業界経験に基づいて、アイデアを現実世界の人々が使用できるものに変換するプロセスをガイドします。
第 1 章 - 人工知能の展望を探る|オンラインで読む |数字
1950 年代から現在に至るまで、この進化する状況をツアーし、完璧なディープ ラーニング レシピを構成する要素を分析し、一般的な AI 用語とデータセットに慣れ、責任ある AI の世界を覗いてみましょう。
第 2 章 - 画像の内容: Keras を使用した画像分類|オンラインで読む |数字
わずか 5 行の Keras コードで画像分類の世界を詳しく掘り下げます。次に、ビデオにヒートマップを重ねることで、予測を行う際にニューラル ネットワークがどのような点に注意を払っているかを学習します。ボーナス: Keras の作成者であるFrançois Cholletのやる気を起こさせる個人的な旅を聞き、一人の個人が与える影響を説明します。
第 3 章 - 猫と犬: Keras を使用した 30 行の転移学習|オンラインで読む |数字
転移学習を使用して、以前にトレーニングされたネットワークを新しいカスタム分類タスクで再利用し、数分でほぼ最先端の精度を達成します。次に、結果を細かくスライスして、どの程度適切に分類されているかを理解します。その過程で、本書全体で再利用される共通の機械学習パイプラインを構築します。ボーナス: fast.ai の共同創設者であるJeremy Howardから、何十万人もの学生が転移学習を使用して AI への取り組みを活性化させている方法について聞きました。
第 4 章 - 逆画像検索エンジンの構築: 埋め込みについて|オンラインで読む |数字
Google 逆画像検索と同様に、埋め込み (画像の文脈に応じた表現) を使用して、10 行以内で類似の画像を見つける方法を検討します。そして、さまざまな戦略とアルゴリズムを検討して、数千から数百万の画像まで大規模に高速化し、マイクロ秒で検索できるようにするところから楽しみが始まります。
第 5 章 - 初心者からマスター予測者へ: 畳み込みニューラル ネットワークの精度を最大化する|オンラインで読む |数字
TensorBoard、What-If Tool、tf-explain、TensorFlow Datasets、AutoKeras、AutoAugment などのさまざまなツールを利用して、分類器が達成できる精度を最大化する戦略を検討します。その過程で、どのパラメータが AI タスクに機能するか、または機能しないかを直感的に理解するために実験を実施します。
第 6 章 - TensorFlow の速度とパフォーマンスの最大化: 便利なチェックリスト|オンラインで読む |数字
30 のトリックのチェックリストに従うことで、トレーニングと推論の速度をハイパードライブに取り入れ、非効率をできる限り削減し、現在のハードウェアの価値を最大化します。
第 7 章 - 実用的なツール、ヒント、コツ|オンラインで読む |数字
私たちは、設置、データ収集、実験管理、視覚化、研究の最先端の追跡から理論的基礎を構築するためのさらなる手段の探索に至るまで、さまざまなトピックやツールにおける実践的なスキルを多様化します。ディープラーニングの。
第 8 章 - コンピューター ビジョン用のクラウド API: 15 分で起動して実行|オンラインで読む |数字
一生懸命ではなく賢く働きましょう。 Google、Microsoft、Amazon、IBM、Clarifai のクラウド AI プラットフォームの力を 15 分以内に活用します。既存の API で解決できないタスクについては、カスタム分類サービスを使用してコーディングなしで分類器をトレーニングします。そして、オープンベンチマークで両者を対戦させたところ、どちらが勝ったか驚かれるかもしれません。
第 9 章 - TensorFlow Serving と KubeFlow を使用したクラウド上でのスケーラブルな推論サービス|オンラインで読む |数字
カスタム トレーニングされたモデルをクラウド/オンプレミスに導入して、数千万から数百万のリクエストにスケーラブルに対応します。 Flask、Google Cloud ML Engine、TensorFlow Serving、KubeFlow を調査し、労力、シナリオ、費用対効果の分析を紹介します。
第 10 章 - TensorFlow.js と ml5.js を使用したブラウザ内の AI |オンラインで読む |数字
コンピューターまたはスマートフォンを使用するすべての個人は、一律に 1 つのソフトウェア プログラム、つまりブラウザーにアクセスできます。 TensorFlow.js や ml5.js などのブラウザベースの深層学習ライブラリを使用して、これらすべてのユーザーにリーチします。ゲスト著者のZaid Alyafeaiが、サーバーではなくブラウザ自体で実行される、身体姿勢推定、敵対的生成ネットワーク (GAN)、Pix2Pix による画像間の変換などのテクニックとタスクについて説明します。ボーナス: TensorFlow.js チームと ml5.js チームから、プロジェクトがどのようにインキュベートされたかについて話を聞きます。
第 11 章 - Core ML を使用した iOS でのリアルタイム オブジェクト分類|オンラインで読む |数字
Core ML を使用した Apple エコシステムに重点を置き、モバイルにおけるディープラーニングの状況を探ります。さまざまな iPhone でモデルのベンチマークを行い、アプリのサイズとエネルギーへの影響を軽減する戦略、動的モデルの展開、デバイス上でのトレーニング、プロフェッショナルなアプリの構築方法を調査します。
第 12 章 - Core ML と Create ML を使用した iOS 上のホットドッグではない|オンラインで読む |数字
シリコンバレーの Not Hotdog アプリ (HBO 提供) はモバイル AI の「Hello World」とみなされているため、1 つではなく 2 つではなく、3 つの異なる方法でリアルタイム バージョンを構築することで敬意を表します。
第 13 章 - Shazam for Food: TensorFlow Lite と ML Kit を使用した Android アプリの開発|オンラインで読む |数字
TensorFlow Lite を利用して AI を Android に導入します。次に、ML Kit (TensorFlow Lite 上に構築されている) と Fritz を使用したクロスプラットフォーム開発を見て、自己改善型 AI アプリを構築するためのエンドツーエンドの開発ライフ サイクルを調査します。その過程で、モデルのバージョン管理、A/B テスト、成功の測定、動的更新、モデルの最適化などのトピックについて見ていきます。ボーナス: AI をエッジ デバイスに導入する際のPete Warden (モバイルおよび組み込み TensorFlow の技術リード) の豊富な経験について聞くことができます。
第 14 章 - TensorFlow オブジェクト検出 API を使用した Purrfect Cat Locator アプリの構築|オンラインで読む |数字
画像内のオブジェクトの位置を特定するための 4 つの異なる方法を検討します。長年にわたる物体検出の進化を考察し、速度と精度の間のトレードオフを分析します。これにより、群衆カウント、顔検出、自動運転車などのケーススタディの基盤が構築されます。
第 15 章 - メーカーになる: エッジの組み込み AI を探索する|オンラインで読む |数字
ゲスト著者の Sam Sterckval 氏は、Raspberry Pi、NVIDIA Jetson Nano、Google Coral、Intel Movidius、PYNQ-Z2 FPGA など、処理能力とコストが異なるさまざまな AI 対応エッジ デバイスを紹介しながら、低電力デバイスにディープ ラーニングをもたらします。ロボット工学とメーカープロジェクトの扉。ボーナス: NVIDIA Jetson Nano チームが、オープンソースのレシピブックを使って創造的なロボットを迅速に構築している方法について聞きます。
第 16 章 - Keras によるエンドツーエンドの深層学習を使用した自動運転車のシミュレーション|オンラインで読む |数字
ゲスト著者のAditya Sharma 氏とMitchell Spryn 氏は、Microsoft AirSim のフォトリアリスティックなシミュレーション環境を使用して、最初に環境内で車を運転し、次に AI モデルにその動作を再現するよう教えることで、仮想車のトレーニングをガイドします。この章では、自動運転車業界に適用できる多くの概念について説明します。
第 17 章 - 1 時間以内で自動運転車を構築: AWS DeepRacer を使用した強化学習|オンラインで読む |数字
仮想世界から物理世界に移り、ゲスト著者のSunil Mallya が、ミニチュアカーである AWS DeepRacer を 1 時間以内に組み立て、トレーニングし、レースする方法を紹介します。そして、強化学習の助けを借りて、車は自ら運転することを学習し、間違いを罰し、成功を最大化します。この知識を AI ドライビング オリンピックから RoboRace (フルサイズの自動運転車を使用) までのレースに応用する方法を学びます。ボーナス: 自動運転自動車業界がどこに向かっているのかについて、 Anima Anandkumar (NVIDIA)とChris Anderson (DIY Robocars 創設者)から聞きます。
まずは、ようこそ!深層学習について詳しく学ぶためにこの書籍とコードを使用することに決めていただき、嬉しく思います。皆様のご多幸をお祈り申し上げます。リポジトリを使用する際に留意すべき点がいくつかあります。
code
フォルダーにあります。Google Colab に GitHub リポジトリをロードするには、次の手順に従ってください。ローカル システムのデータを使用するため、自分の Google ドライブにアクセスする必要があることに注意してください。
この本では、 practicaldl
という名前のvirtualenv
使用します。このvirtualenv
のrequirements.txt
ルートディレクトリにあります。 virtualenv
インストールするためのヘルプと手順は、FAQ ドキュメントの「インストール」セクションにあります。
CONTRIBUTING に従って問題を提出してください。調査させていただきます。
@AnirudhKoulは著名な AI 専門家であり、国連/TEDx の講演者であり、Microsoft AI & Research の元科学者でもあり、そこで Seeing AI を設立しました。この AI は、iPhone 以降視覚障害者コミュニティの間で最も使用されているテクノロジーと考えられています。 Anirudh 氏は、Time Magazine によって 2018 年の最も優れた発明の 1 つとして認められている Aira の AI および研究の責任者を務めています。10 億人のユーザーに機能を出荷し、ペタバイト規模のデータセットで 10 年以上の実稼働指向の応用研究の経験をもたらしています。彼は、拡張現実、ロボティクス、音声、生産性、アクセシビリティのための AI 技術を使用したテクノロジーを開発してきました。 IEEE が「人生を変える」と呼んだ AI for Good 分野での彼の研究は、CES、FCC、MIT、カンヌライオンズ、アメリカ盲人協会から賞を受賞しており、国連、世界経済フォーラム、ホワイトハウスのイベントで紹介されています。 、貴族院、Netflix、ナショナル ジオグラフィックで評価され、ジャスティン トルドー氏やテリーザ メイ氏を含む世界の指導者からも称賛されています。
@SiddhaGanjuは、Forbes の 30 歳未満の 30 人リストで紹介された AI 研究者で、Nvidia の自動運転アーキテクトです。 NASA FDL の AI アドバイザーとして、彼女は NASA の CAMS プロジェクトの自動流星検出パイプラインの構築を支援し、最終的に彗星を発見しました。以前は Deep Vision で、リソース制約のあるエッジ デバイス向けの深層学習モデルを開発していました。彼女の研究は、視覚的質問応答から敵対的生成ネットワーク、CERN のペタバイト規模のデータからの洞察の収集まで多岐にわたり、CVPR や NeurIPS などのトップレベルのカンファレンスで発表されています。彼女は、CES を含むいくつかの国際技術コンテストで注目の審査員を務めてきました。テクノロジーにおける多様性と包括性の提唱者として、彼女は学校や大学で講演し、あらゆる背景を持つ新世代のテクノロジーに動機を与え、成長させています。
@MeherKasamは、毎日何千万ものユーザーが使用するアプリを開発している経験豊かなソフトウェア開発者です。現在は Square の iOS 開発者であり、以前は Microsoft や Amazon で働いていたこともあり、Square の POS から Bing iPhone アプリまで、さまざまなアプリの機能を提供してきました。以前は Microsoft に勤務し、Seeing AI アプリのモバイル開発リーダーを務めていました。このアプリは、数例を挙げると、Mobile World Congress、CES、FCC、American Council of the Blind などから広く認められ、賞を受賞しています。彼は素早いプロトタイピングのセンスを持つ根っからのハッカーで、いくつかのハッカソンで優勝し、それらを広く使用されている製品に搭載される機能に変換してきました。また、Global Mobile Awards や Edison Awards などの国際コンテストの審査員も務めています。
私たちのコードを使用する場合は引用してください。
@book{Koul2019PracticalDLBook,
title={Practical Deep Learning for Cloud, Mobile and Edge: Real-World AI and Computer Vision Projects Using Python, Keras and TensorFlow},
author={Koul, A. and Ganju, S. and Kasam, M.},
isbn={9781492034865},
url={https://www.oreilly.com/library/view/practical-deep-learning/9781492034858/},
year={2019},
publisher={O'Reilly Media, Incorporated}
}