Ini adalah gudang kode resmi untuk Publikasi O'Reilly, Pembelajaran Mendalam Praktis untuk Cloud, Seluler, dan Edge oleh Anirudh Koul, Siddha Ganju dan Meher Kasam. ** Ditampilkan sebagai sumber belajar di situs resmi Keras ** |
---|
[Online di Safari] | [Beli di Amazon] | [Online di Google Buku] | [Situs Web Buku] | [Presentasi di Slideshare]
Baik Anda seorang insinyur perangkat lunak yang bercita-cita memasuki dunia pembelajaran mendalam, ilmuwan data veteran, atau penghobi yang memiliki impian sederhana untuk membuat aplikasi AI viral berikutnya, Anda mungkin bertanya-tanya dari mana saya harus memulainya? Panduan langkah demi langkah ini mengajarkan Anda cara membuat aplikasi pembelajaran mendalam yang praktis untuk cloud, seluler, browser, dan perangkat edge menggunakan pendekatan langsung.
Mengandalkan pengalaman industri selama bertahun-tahun dalam mengubah penelitian pembelajaran mendalam menjadi aplikasi pemenang penghargaan, Anirudh Koul, Siddha Ganju, dan Meher Kasam memandu Anda melalui proses mengubah ide menjadi sesuatu yang dapat digunakan oleh orang-orang di dunia nyata.
Bab 1 - Menjelajahi Lanskap Kecerdasan Buatan | Baca daring | Angka
Kami mengikuti tur lanskap yang terus berkembang ini, dari tahun 1950-an hingga saat ini, dan menganalisis bahan-bahan yang menghasilkan resep pembelajaran mendalam yang sempurna, mengenal terminologi dan kumpulan data AI yang umum, dan mengintip dunia AI yang bertanggung jawab.
Bab 2 - Apa yang Ada di Gambar: Klasifikasi Gambar dengan Keras | Baca daring | Angka
Kami mempelajari dunia klasifikasi gambar hanya dalam lima baris kode Keras. Kami kemudian mempelajari apa yang diperhatikan jaringan saraf saat membuat prediksi dengan melapisi peta panas pada video. Bonus: kita mendengar perjalanan pribadi yang memotivasi dari François Chollet , pencipta Keras, yang menggambarkan dampak yang dapat ditimbulkan oleh seorang individu.
Bab 3 - Kucing versus Anjing: Mentransfer Pembelajaran dalam 30 Baris dengan Keras | Baca daring | Angka
Kami menggunakan pembelajaran transfer untuk menggunakan kembali jaringan yang telah dilatih sebelumnya pada tugas klasifikasi khusus baru untuk mendapatkan akurasi yang mendekati canggih dalam hitungan menit. Kami kemudian membagi hasilnya untuk memahami seberapa baik klasifikasinya. Sepanjang proses ini, kami membangun alur pembelajaran mesin umum, yang digunakan kembali di seluruh buku ini. Bonus: kami mendengar dari Jeremy Howard , salah satu pendiri fast.ai, tentang bagaimana ratusan ribu siswa menggunakan pembelajaran transfer untuk memulai perjalanan AI mereka.
Bab 4 - Membangun Mesin Pencari Gambar Terbalik: Memahami Embeddings | Baca daring | Angka
Seperti Google Reverse Image Search, kami mengeksplorasi cara menggunakan embeddings—representasi kontekstual dari sebuah gambar untuk menemukan gambar serupa dalam kurang dari sepuluh baris. Dan kesenangannya dimulai saat kami mengeksplorasi berbagai strategi dan algoritme untuk mempercepatnya dalam skala besar, dari ribuan hingga beberapa juta gambar, dan membuatnya dapat ditelusuri dalam hitungan mikrodetik.
Bab 5 - Dari Pemula hingga Prediktor Utama: Memaksimalkan Akurasi Jaringan Neural Konvolusional | Baca daring | Angka
Kami mengeksplorasi strategi untuk memaksimalkan akurasi yang dapat dicapai pengklasifikasi kami, dengan bantuan berbagai alat termasuk TensorBoard, What-If Tool, tf-explain, TensorFlow Datasets, AutoKeras, AutoAugment. Selama prosesnya, kami melakukan eksperimen untuk mengembangkan intuisi tentang parameter apa yang mungkin berfungsi atau tidak untuk tugas AI Anda.
Bab 6 - Memaksimalkan Kecepatan dan Performa TensorFlow: Daftar Periksa Praktis | Baca daring | Angka
Kami memanfaatkan kecepatan pelatihan dan inferensi ke dalam hyperdrive dengan memeriksa daftar 30 trik untuk mengurangi sebanyak mungkin inefisiensi dan memaksimalkan nilai perangkat keras Anda saat ini.
Bab 7 - Alat Praktis, Tip, dan Trik | Baca daring | Angka
Kami mendiversifikasi keterampilan praktis kami dalam berbagai topik dan alat, mulai dari instalasi, pengumpulan data, manajemen eksperimen, visualisasi, melacak perkembangan penelitian terkini hingga mengeksplorasi jalan lebih jauh untuk membangun landasan teoretis. pembelajaran mendalam.
Bab 8 - API Cloud untuk Computer Vision: Aktif dan Berjalan dalam 15 Menit | Baca daring | Angka
Bekerja cerdas, bukan keras. Kami memanfaatkan kekuatan platform cloud AI dari Google, Microsoft, Amazon, IBM, dan Clarifai dalam waktu kurang dari 15 menit. Untuk tugas yang tidak diselesaikan dengan API yang ada, kami kemudian menggunakan layanan klasifikasi khusus untuk melatih pengklasifikasi tanpa coding. Dan kemudian kami mengadu mereka satu sama lain dalam benchmark terbuka, Anda mungkin akan terkejut siapa yang menang.
Bab 9 - Penyajian Inferensi yang Dapat Diskalakan di Cloud dengan Penyajian TensorFlow dan KubeFlow | Baca daring | Angka
Kami membawa model terlatih khusus kami ke cloud/on-premise untuk melayani puluhan hingga jutaan permintaan secara skalabel. Kami menjelajahi Flask, Google Cloud ML Engine, TensorFlow Serving, dan KubeFlow, yang menampilkan upaya, skenario, dan analisis biaya-manfaat.
Bab 10 - AI di Browser dengan TensorFlow.js dan ml5.js | Baca daring | Angka
Setiap individu yang menggunakan komputer atau ponsel cerdas secara seragam memiliki akses ke satu program perangkat lunak—browser mereka. Jangkau semua pengguna tersebut dengan perpustakaan pembelajaran mendalam berbasis browser termasuk TensorFlow.js dan ml5.js. Penulis tamu Zaid Alyafeai memandu kita melalui teknik dan tugas seperti estimasi pose tubuh, jaringan permusuhan generatif (GAN), terjemahan gambar-ke-gambar dengan Pix2Pix dan banyak lagi, yang tidak berjalan di server tetapi di browser itu sendiri. Bonus: Dengarkan tim TensorFlow.js dan ml5.js tentang cara proyek diinkubasi.
Bab 11 - Klasifikasi Objek Real-Time di iOS dengan Core ML | Baca daring | Angka
Kami menjelajahi lanskap pembelajaran mendalam di perangkat seluler, dengan fokus tajam pada ekosistem Apple dengan Core ML. Kami melakukan tolok ukur model pada iPhone yang berbeda, menyelidiki strategi untuk mengurangi ukuran aplikasi dan dampak energi, penerapan model dinamis, pelatihan pada perangkat, dan cara aplikasi profesional dibuat.
Bab 12 - Bukan Hotdog di iOS dengan Core ML dan Membuat ML | Baca daring | Angka
Aplikasi Not Hotdog dari Silicon Valley (dari HBO) dianggap sebagai “Hello World” bagi AI seluler, jadi kami memberikan penghormatan dengan membuat versi real-time bukan hanya dengan satu, bukan dua, namun tiga cara berbeda.
Bab 13 - Shazam untuk Makanan: Mengembangkan Aplikasi Android dengan TensorFlow Lite dan ML Kit | Baca daring | Angka
Kami menghadirkan AI ke Android dengan bantuan TensorFlow Lite. Kami kemudian melihat pengembangan lintas platform menggunakan ML Kit (yang dibangun di atas TensorFlow Lite) dan Fritz untuk menjelajahi siklus hidup pengembangan menyeluruh guna membangun aplikasi AI yang dapat meningkatkan kemampuan dirinya sendiri. Selama ini kami membahas pembuatan versi model, pengujian A/B, pengukuran keberhasilan, pembaruan dinamis, pengoptimalan model, dan topik lainnya. Bonus: Kami mendengar tentang pengalaman Pete Warden (pemimpin teknis untuk Seluler dan TensorFlow Tertanam) yang kaya dalam menghadirkan AI ke perangkat edge.
Bab 14 - Membangun Aplikasi Purrfect Cat Locator dengan TensorFlow Object Detection API | Baca daring | Angka
Kami mengeksplorasi empat metode berbeda untuk menemukan posisi objek dalam gambar. Kami melihat evolusi pendeteksian objek selama bertahun-tahun, dan menganalisis keseimbangan antara kecepatan dan akurasi. Hal ini menjadi dasar untuk studi kasus seperti penghitungan massa, deteksi wajah, dan mobil otonom.
Bab 15 - Menjadi Pembuat: Menjelajahi AI yang Tersemat di Edge | Baca daring | Angka
Penulis tamu Sam Sterckval menghadirkan pembelajaran mendalam pada perangkat berdaya rendah saat ia memamerkan serangkaian perangkat edge berkemampuan AI dengan kekuatan pemrosesan dan biaya yang bervariasi termasuk Raspberry Pi, NVIDIA Jetson Nano, Google Coral, Intel Movidius, PYNQ-Z2 FPGA, membuka pintu untuk robotika dan proyek pembuat. Bonus: Dengarkan tim NVIDIA Jetson Nano tentang bagaimana orang membuat robot kreatif dengan cepat dari buku resep sumber terbuka mereka.
Bab 16 - Mensimulasikan Mobil Self-Driving menggunakan Pembelajaran Mendalam End-to-End dengan Keras | Baca daring | Angka
Dengan menggunakan lingkungan simulasi fotorealistik Microsoft AirSim, penulis tamu Aditya Sharma dan Mitchell Spryn memandu kami dalam melatih mobil virtual dengan mengemudikannya terlebih dahulu di dalam lingkungan tersebut dan kemudian mengajarkan model AI untuk meniru perilakunya. Secara keseluruhan, bab ini membahas sejumlah konsep yang dapat diterapkan dalam industri mobil otonom.
Bab 17 - Membangun Mobil Otonom dalam Waktu Kurang dari Satu Jam: Pembelajaran Penguatan dengan AWS DeepRacer | Baca daring | Angka
Beralih dari dunia virtual ke dunia fisik, penulis tamu Sunil Mallya menunjukkan bagaimana AWS DeepRacer, sebuah mobil mini, dapat dirakit, dilatih, dan dilombakan dalam waktu kurang dari satu jam. Dan dengan bantuan pembelajaran penguatan, mobil belajar mengemudi sendiri, menghukum kesalahan, dan memaksimalkan kesuksesan. Kami mempelajari cara menerapkan pengetahuan ini pada balapan mulai dari Olimpiade AI Driving hingga RoboRace (menggunakan mobil otonom berukuran penuh). Bonus: Dengarkan dari Anima Anandkumar (NVIDIA) dan Chris Anderson (pendiri DIY Robocars) tentang arah industri otomotif self-driving.
Pertama, selamat datang! Kami senang Anda memutuskan untuk menggunakan buku dan kode ini untuk mempelajari lebih lanjut tentang Pembelajaran Mendalam! Kami berharap yang terbaik untuk perjalanan Anda ke depan. Berikut beberapa hal yang perlu diingat saat menggunakan repositori.
code
.Harap ikuti petunjuk ini untuk memuat repo GitHub di Google Colab. Ingatlah bahwa Anda memerlukan akses ke Google Drive Anda sendiri karena kami akan menggunakan data dari sistem lokal.
Kami akan menggunakan virtualenv
dengan nama practicaldl
di seluruh buku ini. requirements.txt
untuk virtualenv
ini ada di direktori root. Bantuan dan instruksi untuk menginstal virtualenv
ada di bagian Instalasi di dokumen FAQ.
Silakan ajukan masalah sesuai dengan KONTRIBUSI dan kami akan menyelidikinya.
@AnirudhKoul adalah pakar AI terkemuka, pembicara UN/TEDx, dan mantan ilmuwan di Microsoft AI & Research, tempat ia mendirikan Looking AI, yang sering dianggap sebagai teknologi yang paling banyak digunakan di kalangan komunitas tunanetra setelah iPhone. Anirudh menjabat sebagai Kepala AI & Riset di Aira, yang diakui oleh Majalah Time sebagai salah satu penemuan terbaik tahun 2018. Dengan fitur yang dikirimkan ke satu miliar pengguna, ia membawa lebih dari satu dekade pengalaman Riset Terapan yang berorientasi produksi pada kumpulan data skala PetaByte. Dia telah mengembangkan teknologi menggunakan teknik AI untuk Augmented Reality, Robotika, Ucapan, Produktivitas, serta Aksesibilitas. Karyanya di bidang AI for Good, yang oleh IEEE disebut sebagai 'mengubah hidup', telah menerima penghargaan dari CES, FCC, MIT, Cannes Lions, American Council of the Blind, dipamerkan di acara-acara PBB, Forum Ekonomi Dunia, Gedung Putih , House of Lords, Netflix, National Geographic, dan dipuji oleh para pemimpin dunia termasuk Justin Trudeau dan Theresa May.
@SiddhaGanju , seorang peneliti AI yang ditampilkan Forbes dalam daftar 30 di bawah 30 tahun, adalah Arsitek Self-Driving di Nvidia. Sebagai Penasihat AI untuk FDL NASA, dia membantu membangun jalur pendeteksi meteor otomatis untuk proyek CAMS di NASA, yang akhirnya menemukan sebuah komet. Sebelumnya di Deep Vision, dia mengembangkan model pembelajaran mendalam untuk perangkat edge dengan keterbatasan sumber daya. Karyanya berkisar dari Visual Question Answering hingga Generative Adversarial Networks hingga mengumpulkan wawasan dari data skala petabyte CERN dan telah dipublikasikan di konferensi tingkat atas termasuk CVPR dan NeurIPS. Dia telah menjabat sebagai anggota juri di beberapa kompetisi teknologi internasional termasuk CES. Sebagai penganjur keberagaman dan inklusi dalam teknologi, ia berbicara di sekolah dan perguruan tinggi untuk memotivasi dan menumbuhkan generasi teknologi baru dari semua latar belakang.
@MeherKasam adalah pengembang perangkat lunak berpengalaman dengan aplikasi yang digunakan oleh puluhan juta pengguna setiap hari. Saat ini merupakan pengembang iOS di Square, dan sebelumnya bekerja di Microsoft dan Amazon, ia telah mengirimkan fitur untuk berbagai aplikasi mulai dari Square's Point of Sale hingga aplikasi Bing iPhone. Sebelumnya, ia bekerja di Microsoft, dan menjabat sebagai pemimpin pengembangan seluler untuk aplikasi Looking AI, yang telah menerima pengakuan luas dan penghargaan dari Mobile World Congress, CES, FCC, dan American Council of the Blind, dan masih banyak lagi. Seorang hacker yang memiliki bakat untuk membuat prototipe cepat, dia memenangkan beberapa hackathon dan mengonversinya menjadi fitur yang dikirimkan dalam produk yang banyak digunakan. Ia juga menjabat sebagai juri kompetisi internasional termasuk Global Mobile Awards dan Edison Awards.
Silakan kutip kami jika Anda menggunakan kode kami.
@book{Koul2019PracticalDLBook,
title={Practical Deep Learning for Cloud, Mobile and Edge: Real-World AI and Computer Vision Projects Using Python, Keras and TensorFlow},
author={Koul, A. and Ganju, S. and Kasam, M.},
isbn={9781492034865},
url={https://www.oreilly.com/library/view/practical-deep-learning/9781492034858/},
year={2019},
publisher={O'Reilly Media, Incorporated}
}