นี่คือที่เก็บรหัสอย่างเป็นทางการสำหรับ O'Reilly Publication การเรียนรู้เชิงลึกเชิงปฏิบัติสำหรับระบบคลาวด์ อุปกรณ์เคลื่อนที่ และ Edge โดย Anirudh Koul, Siddha Ganju และ Meher Kasam ** นำเสนอเป็นแหล่งการเรียนรู้บนเว็บไซต์ทางการของ Keras ** |
---|
[ออนไลน์บน Safari] | [ซื้อในอเมซอน] | [ออนไลน์บน Google หนังสือ] | [เว็บไซต์หนังสือ] | [การนำเสนอบน Slideshare]
ไม่ว่าคุณจะเป็นวิศวกรซอฟต์แวร์ที่ต้องการเข้าสู่โลกแห่งการเรียนรู้เชิงลึก นักวิทยาศาสตร์ข้อมูลที่มีประสบการณ์ หรือเป็นงานอดิเรกที่มีความฝันง่ายๆ ในการสร้างแอป AI ที่เป็นไวรัลตัวต่อไป คุณอาจสงสัยว่าฉันจะเริ่มต้นจากตรงไหน คำแนะนำทีละขั้นตอนนี้จะสอนวิธีสร้างแอปพลิเคชันการเรียนรู้เชิงลึกที่ใช้งานได้จริงสำหรับระบบคลาวด์ อุปกรณ์เคลื่อนที่ เบราว์เซอร์ และอุปกรณ์ Edge โดยใช้แนวทางแบบลงมือปฏิบัติจริง
ด้วยประสบการณ์หลายปีในอุตสาหกรรมในการเปลี่ยนแปลงการวิจัยการเรียนรู้เชิงลึกให้เป็นแอปพลิเคชันที่ได้รับรางวัล Anirudh Koul, Siddha Ganju และ Meher Kasam จะแนะนำคุณตลอดกระบวนการแปลงแนวคิดให้เป็นสิ่งที่ผู้คนในโลกแห่งความเป็นจริงสามารถใช้ได้
บทที่ 1 - การสำรวจภูมิทัศน์ของปัญญาประดิษฐ์ | อ่านออนไลน์ | ตัวเลข
เราทัวร์ชมภูมิทัศน์ที่กำลังพัฒนานี้ ตั้งแต่ปี 1950 จนถึงทุกวันนี้ และวิเคราะห์ส่วนผสมที่สร้างสูตรการเรียนรู้เชิงลึกที่สมบูรณ์แบบ ทำความคุ้นเคยกับคำศัพท์และชุดข้อมูล AI ทั่วไป และมองเข้าไปในโลกแห่ง AI ที่มีความรับผิดชอบ
บทที่ 2 - มีอะไรอยู่ในรูปภาพ: การจำแนกรูปภาพด้วย Keras | อ่านออนไลน์ | ตัวเลข
เราเจาะลึกโลกแห่งการจัดหมวดหมู่รูปภาพด้วยโค้ด Keras เพียงห้าบรรทัด จากนั้นเราจะเรียนรู้ว่าโครงข่ายประสาทเทียมให้ความสนใจกับสิ่งใดในขณะที่ทำการคาดการณ์โดยการซ้อนทับแผนที่ความร้อนบนวิดีโอ โบนัส: เราได้ยินการเดินทางส่วนตัวที่สร้างแรงบันดาลใจของ François Chollet ผู้สร้าง Keras ซึ่งแสดงให้เห็นถึงผลกระทบที่บุคคลหนึ่งสามารถมีได้
บทที่ 3 - แมวกับสุนัข: ถ่ายทอดการเรียนรู้ใน 30 บรรทัดด้วย Keras | อ่านออนไลน์ | ตัวเลข
เราใช้การเรียนรู้แบบถ่ายโอนเพื่อนำเครือข่ายที่ได้รับการฝึกมาก่อนหน้านี้กลับมาใช้ใหม่ในงานการจัดหมวดหมู่แบบกำหนดเองใหม่ เพื่อให้ได้รับความแม่นยำที่เกือบล้ำสมัยในเวลาไม่กี่นาที จากนั้นเราจะหั่นผลลัพธ์เป็นลูกเต๋าเพื่อทำความเข้าใจว่าสามารถจำแนกประเภทได้ดีเพียงใด ในระหว่างนี้ เราสร้างไปป์ไลน์แมชชีนเลิร์นนิงทั่วไป ซึ่งนำกลับมาใช้ใหม่ตลอดทั้งเล่ม โบนัส: เราได้รับฟังจาก Jeremy Howard ผู้ร่วมก่อตั้ง fast.ai เกี่ยวกับวิธีที่นักเรียนหลายแสนคนใช้การเรียนรู้แบบถ่ายโอนเพื่อเริ่มต้นการเดินทางด้วย AI อย่างรวดเร็ว
บทที่ 4 - การสร้างเครื่องมือค้นหารูปภาพแบบย้อนกลับ: ทำความเข้าใจกับการฝัง | อ่านออนไลน์ | ตัวเลข
เช่นเดียวกับ Google Reverse Image Search เราสำรวจว่าเราจะใช้การฝังได้อย่างไร ซึ่งเป็นการนำเสนอรูปภาพตามบริบทเพื่อค้นหารูปภาพที่คล้ายกันภายในสิบบรรทัด จากนั้นความสนุกก็เริ่มต้นขึ้นเมื่อเราสำรวจกลยุทธ์และอัลกอริธึมต่างๆ เพื่อเร่งความเร็วในการขยายขนาด ตั้งแต่หลายพันไปจนถึงหลายล้านภาพ และทำให้สามารถค้นหาได้ในเสี้ยววินาที
บทที่ 5 - จากมือใหม่สู่ผู้ทำนายระดับปรมาจารย์: การเพิ่มความแม่นยำของโครงข่ายประสาทเทียมแบบ Convolutional สูงสุด | อ่านออนไลน์ | ตัวเลข
เราสำรวจกลยุทธ์เพื่อเพิ่มความแม่นยำสูงสุดที่ตัวแยกประเภทของเราสามารถทำได้ ด้วยความช่วยเหลือของเครื่องมือต่างๆ รวมถึง TensorBoard, What-If Tool, tf-explain, ชุดข้อมูล TensorFlow, AutoKeras, AutoAugment ในระหว่างนี้ เราทำการทดลองเพื่อพัฒนาสัญชาตญาณว่าพารามิเตอร์ใดบ้างที่อาจใช้ได้หรือไม่ได้กับงาน AI ของคุณ
บทที่ 6 - การเพิ่มความเร็วและประสิทธิภาพของ TensorFlow: รายการตรวจสอบที่มีประโยชน์ | อ่านออนไลน์ | ตัวเลข
เราใช้ความเร็วของการฝึกอบรมและการอนุมานในไฮเปอร์ไดรฟ์โดยผ่านรายการตรวจสอบเคล็ดลับ 30 ข้อเพื่อลดความไร้ประสิทธิภาพให้มากที่สุดเท่าที่จะเป็นไปได้ และเพิ่มมูลค่าของฮาร์ดแวร์ปัจจุบันของคุณให้สูงสุด
บทที่ 7 - เครื่องมือ เคล็ดลับ และคำแนะนำที่เป็นประโยชน์ | อ่านออนไลน์ | ตัวเลข
เรากระจายทักษะการปฏิบัติของเราในหัวข้อและเครื่องมือที่หลากหลาย ตั้งแต่การติดตั้ง การรวบรวมข้อมูล การจัดการการทดลอง การแสดงภาพ การติดตามความล้ำสมัยในการวิจัย ไปจนถึงการสำรวจช่องทางเพิ่มเติมสำหรับการสร้างรากฐานทางทฤษฎี ของการเรียนรู้เชิงลึก
บทที่ 8 - Cloud API สำหรับคอมพิวเตอร์วิทัศน์: พร้อมใช้งานใน 15 นาที | อ่านออนไลน์ | ตัวเลข
ทำงานอย่างชาญฉลาด ไม่ยาก เราใช้พลังของแพลตฟอร์ม AI บนคลาวด์จาก Google, Microsoft, Amazon, IBM และ Clarifai ภายในเวลาไม่ถึง 15 นาที สำหรับงานที่ไม่ได้รับการแก้ไขด้วย API ที่มีอยู่ เราจะใช้บริการการจัดหมวดหมู่แบบกำหนดเองเพื่อฝึกตัวแยกประเภทโดยไม่ต้องเขียนโค้ด จากนั้นเราก็แข่งขันกันในเกณฑ์มาตรฐานแบบเปิด คุณอาจแปลกใจว่าใครเป็นผู้ชนะ
บทที่ 9 - การให้บริการการอนุมานที่ปรับขนาดได้บนคลาวด์ด้วยการให้บริการ TensorFlow และ KubeFlow อ่านออนไลน์ | ตัวเลข
เราใช้โมเดลที่ผ่านการฝึกอบรมแบบกำหนดเองของเราไปยังระบบคลาวด์/ในองค์กรเพื่อรองรับคำขอหลายสิบถึงล้านคำขอแบบปรับขนาดได้ เราสำรวจ Flask, Google Cloud ML Engine, TensorFlow Serving และ KubeFlow โดยนำเสนอความพยายาม สถานการณ์ และการวิเคราะห์ต้นทุนและผลประโยชน์
บทที่ 10 - AI ในเบราว์เซอร์ด้วย TensorFlow.js และ ml5.js | อ่านออนไลน์ | ตัวเลข
ทุกคนที่ใช้คอมพิวเตอร์หรือสมาร์ทโฟนเหมือนกันจะสามารถเข้าถึงโปรแกรมซอฟต์แวร์ตัวเดียวได้ นั่นก็คือเบราว์เซอร์ของพวกเขา เข้าถึงผู้ใช้ทั้งหมดด้วยไลบรารีการเรียนรู้เชิงลึกบนเบราว์เซอร์ รวมถึง TensorFlow.js และ ml5.js ผู้เขียนรับเชิญ Zaid Alyafeai จะอธิบายเทคนิคและงานต่างๆ ให้เราทราบ เช่น การประมาณท่าทางร่างกาย เครือข่ายปฏิปักษ์ทั่วไป (GAN) การแปลภาพเป็นภาพด้วย Pix2Pix และอื่นๆ อีกมากมาย โดยไม่ได้ทำงานบนเซิร์ฟเวอร์ แต่ทำงานในเบราว์เซอร์เอง โบนัส: รับฟังจากทีม TensorFlow.js และ ml5.js เกี่ยวกับวิธีการบ่มเพาะโปรเจ็กต์
บทที่ 11 - การจำแนกวัตถุแบบเรียลไทม์บน iOS ด้วย Core ML | อ่านออนไลน์ | ตัวเลข
เราสำรวจภูมิทัศน์ของการเรียนรู้เชิงลึกบนมือถือ โดยเน้นไปที่ระบบนิเวศของ Apple ด้วย Core ML เราเปรียบเทียบโมเดลต่างๆ บน iPhone ที่แตกต่างกัน ตรวจสอบกลยุทธ์เพื่อลดขนาดแอปและผลกระทบด้านพลังงาน การใช้งานโมเดลแบบไดนามิก การฝึกอบรมบนอุปกรณ์ และวิธีการสร้างแอประดับมืออาชีพ
บทที่ 12 - ไม่ใช่ Hotdog บน iOS ด้วย Core ML และสร้าง ML | อ่านออนไลน์ | ตัวเลข
แอป Not Hotdog ของ Silicon Valley (จาก HBO) ถือเป็น "Hello World" ของ AI บนมือถือ ดังนั้นเราจึงยกย่องด้วยการสร้างเวอร์ชันเรียลไทม์ด้วยวิธีการที่แตกต่างกันสามวิธี ไม่ใช่วิธีเดียว ไม่ใช่สองวิธี
บทที่ 13 - Shazam สำหรับอาหาร: การพัฒนาแอป Android ด้วย TensorFlow Lite และ ML Kit | อ่านออนไลน์ | ตัวเลข
เรานำ AI มาสู่ Android ด้วยความช่วยเหลือของ TensorFlow Lite จากนั้นเราจะดูการพัฒนาข้ามแพลตฟอร์มโดยใช้ ML Kit (ซึ่งสร้างบน TensorFlow Lite) และ Fritz เพื่อสำรวจวงจรชีวิตการพัฒนาแบบ end-to-end สำหรับการสร้างแอป AI ที่ปรับปรุงตนเอง ในระหว่างที่เราดูการกำหนดเวอร์ชันโมเดล การทดสอบ A/B การวัดความสำเร็จ การอัปเดตแบบไดนามิก การเพิ่มประสิทธิภาพโมเดล และหัวข้ออื่นๆ โบนัส: เราได้รับทราบเกี่ยวกับประสบการณ์อันยาวนาน ของ Pete Warden (หัวหน้าฝ่ายเทคนิคสำหรับมือถือและ Embedded TensorFlow) ในการนำ AI ไปยังอุปกรณ์ Edge
บทที่ 14 - การสร้างแอป Purrfect Cat Locator ด้วย TensorFlow Object Detection API | อ่านออนไลน์ | ตัวเลข
เราสำรวจวิธีการต่างๆ สี่วิธีในการค้นหาตำแหน่งของวัตถุภายในภาพ เราจะดูวิวัฒนาการของการตรวจจับวัตถุในช่วงหลายปีที่ผ่านมา และวิเคราะห์ข้อดีข้อเสียระหว่างความเร็วและความแม่นยำ สิ่งนี้จะสร้างฐานสำหรับกรณีศึกษา เช่น การนับฝูงชน การตรวจจับใบหน้า และรถยนต์ขับเคลื่อนอัตโนมัติ
บทที่ 15 - การเป็นผู้สร้าง: สำรวจ AI แบบฝังที่ Edge | อ่านออนไลน์ | ตัวเลข
ผู้เขียนรับเชิญ Sam Sterckval นำการเรียนรู้เชิงลึกมาสู่อุปกรณ์ที่ใช้พลังงานต่ำ ในขณะที่เขานำเสนออุปกรณ์ Edge ที่รองรับ AI มากมาย พร้อมพลังการประมวลผลและราคาที่แตกต่างกัน รวมถึง Raspberry Pi, NVIDIA Jetson Nano, Google Coral, Intel Movidius, PYNQ-Z2 FPGA ซึ่งเป็นการเปิด ประตูสำหรับโครงการหุ่นยนต์และผู้ผลิต โบนัส: ฟังจาก ทีมงาน NVIDIA Jetson Nano เกี่ยวกับวิธีที่ผู้คนสร้างหุ่นยนต์สร้างสรรค์อย่างรวดเร็วจากหนังสือสูตรอาหารแบบโอเพ่นซอร์ส
บทที่ 16 - การจำลองรถยนต์ที่ขับเคลื่อนด้วยตนเองโดยใช้การเรียนรู้เชิงลึกแบบ End-to-End กับ Keras | อ่านออนไลน์ | ตัวเลข
การใช้สภาพแวดล้อมการจำลองเสมือนจริงของ Microsoft AirSim ผู้เขียนรับเชิญ Aditya Sharma และ Mitchell Spryn แนะนำเราในการฝึกอบรมรถยนต์เสมือนจริงโดยการขับรถในสภาพแวดล้อมก่อน จากนั้นจึงสอนโมเดล AI เพื่อจำลองพฤติกรรมของมัน ตลอดเนื้อหา บทนี้ครอบคลุมแนวคิดจำนวนหนึ่งที่สามารถนำไปใช้ได้ในอุตสาหกรรมรถยนต์ขับเคลื่อนอัตโนมัติ
บทที่ 17 - การสร้างรถยนต์อัตโนมัติภายในหนึ่งชั่วโมง: การเรียนรู้แบบเสริมกำลังด้วย AWS DeepRacer อ่านออนไลน์ | ตัวเลข
Sunil Mallya ผู้เขียนรับเชิญย้ายจากโลกเสมือนจริงมาสู่โลกทางกายภาพ แสดงให้เห็นว่า AWS DeepRacer ซึ่งเป็นรถยนต์ขนาดเล็กสามารถประกอบ ฝึกฝน และแข่งขันได้ภายในหนึ่งชั่วโมง และด้วยความช่วยเหลือของการเรียนรู้แบบเสริมกำลัง รถจะเรียนรู้ที่จะขับรถด้วยตัวเอง ลงโทษข้อผิดพลาด และเพิ่มความสำเร็จสูงสุด เราเรียนรู้วิธีใช้ความรู้นี้กับการแข่งขันตั้งแต่การแข่งขันกีฬาโอลิมปิกของ AI Driving ไปจนถึง RoboRace (โดยใช้รถยนต์ขับเคลื่อนอัตโนมัติขนาดเต็ม) โบนัส: รับฟังจาก Anima Anandkumar (NVIDIA) และ Chris Anderson (ผู้ก่อตั้ง DIY Robocars) เกี่ยวกับทิศทางที่อุตสาหกรรมยานยนต์ไร้คนขับกำลังมุ่งหน้าไป
ก่อนอื่นยินดีต้อนรับ! เรามีความยินดีที่คุณตัดสินใจใช้หนังสือและโค้ดเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับ Deep Learning! เราหวังว่าคุณจะได้รับสิ่งที่ดีที่สุดสำหรับการเดินทางไปข้างหน้า ต่อไปนี้เป็นสิ่งที่ควรคำนึงถึงขณะใช้งานพื้นที่เก็บข้อมูล
code
โปรดปฏิบัติตามคำแนะนำเหล่านี้เพื่อโหลด repo GitHub บน Google Colab โปรดทราบว่าคุณจะต้องเข้าถึง Google ไดรฟ์ของคุณเอง เนื่องจากเราจะใช้ข้อมูลจากระบบในเครื่อง
เราจะใช้ virtualenv
ในชื่อ practicaldl
ตลอดทั้งเล่ม requirements.txt
สำหรับ virtualenv
นี้อยู่ในไดเร็กทอรีราก วิธีใช้และคำแนะนำในการติดตั้ง virtualenv
อยู่ในส่วนการติดตั้งในเอกสารคำถามที่พบบ่อย
โปรดยื่นเรื่องตาม CONTRIBUTING แล้วเราจะตรวจสอบ
@AnirudhKoul เป็นผู้เชี่ยวชาญด้าน AI, วิทยากร UN/TEDx และอดีตนักวิทยาศาสตร์ที่ Microsoft AI & Research ซึ่งเขาก่อตั้ง Seeing AI ซึ่งมักถือเป็นเทคโนโลยีที่ใช้มากที่สุดในชุมชนคนตาบอดรองจาก iPhone Anirudh ทำหน้าที่เป็นหัวหน้าฝ่าย AI และการวิจัยที่ Aira ซึ่งนิตยสาร Time ได้รับการยอมรับว่าเป็นหนึ่งในสิ่งประดิษฐ์ที่ดีที่สุดประจำปี 2018 ด้วยฟีเจอร์ที่จัดส่งให้กับผู้ใช้นับพันล้านคน เขานำประสบการณ์การวิจัยประยุกต์ที่มุ่งเน้นการผลิตมามากกว่าทศวรรษมาในชุดข้อมูลขนาด PetaByte เขาพัฒนาเทคโนโลยีโดยใช้เทคนิค AI สำหรับ Augmented Reality, Robotics, Speech, Productivity และ Accessibility ผลงานของเขาในสาขา AI for Good ซึ่ง IEEE เรียกว่า 'การเปลี่ยนแปลงชีวิต' ได้รับรางวัลจาก CES, FCC, MIT, Cannes Lions, American Council of the Blind ซึ่งจัดแสดงในงานต่างๆ ของ UN, World Economic Forum, ทำเนียบขาว , House of Lords, Netflix, National Geographic และได้รับการยกย่องจากผู้นำระดับโลกอย่าง Justin Trudeau และ Theresa May
@SiddhaGanju นักวิจัยด้าน AI ที่อยู่ในรายชื่อ 30 ต่ำกว่า 30 ของ Forbes เป็นสถาปนิกที่ขับเคลื่อนด้วยตนเองของ Nvidia ในฐานะที่ปรึกษา AI ของ NASA FDL เธอช่วยสร้างท่อส่งการตรวจจับดาวตกแบบอัตโนมัติสำหรับโครงการ CAMS ที่ NASA ซึ่งจบลงด้วยการค้นพบดาวหาง ก่อนหน้านี้ที่ Deep Vision เธอได้พัฒนาโมเดลการเรียนรู้เชิงลึกสำหรับอุปกรณ์ Edge ที่มีข้อจำกัดด้านทรัพยากร งานของเธอมีตั้งแต่การตอบคำถามด้วยภาพ ไปจนถึง Generative Adversarial Networks ไปจนถึงการรวบรวมข้อมูลเชิงลึกจากข้อมูลระดับเพตะไบต์ของ CERN และได้รับการเผยแพร่ในการประชุมระดับสูง เช่น CVPR และ NeurIPS เธอเคยดำรงตำแหน่งสมาชิกคณะลูกขุนในการแข่งขันเทคโนโลยีระดับนานาชาติหลายครั้ง รวมถึงงาน CES ในฐานะผู้สนับสนุนความหลากหลายและการไม่แบ่งแยกในเทคโนโลยี เธอพูดที่โรงเรียนและวิทยาลัยเพื่อกระตุ้นและขยายเทคโนโลยีรุ่นใหม่จากทุกภูมิหลัง
@MeherKasam เป็นนักพัฒนาซอฟต์แวร์ที่มีประสบการณ์ซึ่งมีแอปที่ใช้งานโดยผู้ใช้หลายสิบล้านคนทุกวัน ปัจจุบันเป็นนักพัฒนา iOS ที่ Square และเคยทำงานที่ Microsoft และ Amazon มาก่อน เขาได้จัดส่งฟีเจอร์สำหรับแอพต่างๆ ตั้งแต่จุดขายของ Square ไปยังแอพ Bing iPhone ก่อนหน้านี้ เขาทำงานที่ Microsoft ซึ่งเขาดำรงตำแหน่งหัวหน้าฝ่ายพัฒนาอุปกรณ์เคลื่อนที่สำหรับแอป Seeing AI ซึ่งได้รับการยอมรับและรางวัลอย่างกว้างขวางจาก Mobile World Congress, CES, FCC และ American Council of the Blind และอีกมากมาย เขาเป็นแฮ็กเกอร์ที่มีไหวพริบในการสร้างต้นแบบอย่างรวดเร็ว เขาชนะการแข่งขันแฮ็กกาธอนหลายครั้ง และเปลี่ยนให้เป็นฟีเจอร์ที่จัดส่งในผลิตภัณฑ์ที่ใช้กันอย่างแพร่หลาย นอกจากนี้เขายังทำหน้าที่เป็นผู้ตัดสินการแข่งขันระดับนานาชาติ รวมถึง Global Mobile Awards และ Edison Awards
โปรดอ้างอิงถึงเราหากคุณใช้รหัสของเรา
@book{Koul2019PracticalDLBook,
title={Practical Deep Learning for Cloud, Mobile and Edge: Real-World AI and Computer Vision Projects Using Python, Keras and TensorFlow},
author={Koul, A. and Ganju, S. and Kasam, M.},
isbn={9781492034865},
url={https://www.oreilly.com/library/view/practical-deep-learning/9781492034858/},
year={2019},
publisher={O'Reilly Media, Incorporated}
}