이것은 O'Reilly Publication의 공식 코드 저장소입니다. 클라우드, 모바일, 엣지를 위한 실용적인 딥 러닝 아니루드 코울(Anirudh Koul), 싯다 간주(Siddha Ganju), 메허 카삼(Meher Kasam) 저. ** 공식 Keras 웹사이트에 학습 리소스로 소개됨 ** |
---|
[사파리 온라인] | [아마존에서 구매] | [Google 도서 온라인] | [도서사이트] | [슬라이드쉐어 프레젠테이션]
딥 러닝의 세계에 입문하려는 소프트웨어 엔지니어, 베테랑 데이터 과학자, 차세대 바이러스 AI 앱을 만드는 단순한 꿈을 가진 취미생활자라면 어디서부터 시작해야 할지 궁금할 것입니다. 이 단계별 가이드에서는 실습 접근 방식을 사용하여 클라우드, 모바일, 브라우저 및 엣지 장치를 위한 실용적인 딥 러닝 애플리케이션을 구축하는 방법을 알려줍니다.
Anirudh Koul, Siddha Ganju 및 Meher Kasam은 딥 러닝 연구를 수상 경력이 있는 애플리케이션으로 전환한 수년간의 업계 경험을 바탕으로 아이디어를 현실 세계의 사람들이 사용할 수 있는 것으로 변환하는 과정을 안내합니다.
1장 - 인공 지능 환경 탐색 | 온라인으로 읽기 | 피규어
우리는 1950년대부터 오늘날까지 진화하는 환경을 둘러보고 완벽한 딥 러닝 레시피를 만드는 성분을 분석하고 일반적인 AI 용어 및 데이터 세트에 익숙해지며 책임 있는 AI의 세계를 엿볼 수 있습니다.
2장 - 그림 속 내용: Keras를 사용한 이미지 분류 | 온라인으로 읽기 | 피규어
우리는 단 다섯 줄의 Keras 코드로 이미지 분류의 세계를 탐구합니다. 그런 다음 비디오에 히트맵을 오버레이하여 예측을 하면서 신경망이 어떤 것에 주의를 기울이고 있는지 알아봅니다. 보너스: Keras의 창시자인 François Chollet 의 동기 부여가 되는 개인적인 여정을 통해 한 개인이 미칠 수 있는 영향을 설명합니다.
3장 - 고양이 대 개: Keras를 사용한 30줄의 전이 학습 | 온라인으로 읽기 | 피규어
우리는 이전에 훈련된 네트워크를 새로운 사용자 정의 분류 작업에 재사용하기 위해 전이 학습을 사용하여 몇 분 만에 거의 최첨단 정확도를 얻습니다. 그런 다음 결과를 쪼개서 분류하여 얼마나 잘 분류되는지 이해합니다. 그 과정에서 우리는 책 전반에 걸쳐 용도가 변경되는 공통 기계 학습 파이프라인을 구축합니다. 보너스: fast.ai의 공동 창립자인 Jeremy Howard 로부터 수십만 명의 학생들이 전이 학습을 사용하여 AI 여정을 시작하는 방법에 대해 듣습니다.
4장 - 역방향 이미지 검색 엔진 구축: 임베딩 이해 | 온라인으로 읽기 | 피규어
Google 역방향 이미지 검색과 마찬가지로 우리는 이미지를 상황에 맞게 표현하여 10줄 미만의 유사한 이미지를 찾는 임베딩을 사용하는 방법을 탐구합니다. 그런 다음 다양한 전략과 알고리즘을 탐색하여 수천 이미지에서 수백만 이미지까지 속도를 높이고 마이크로초 단위로 검색 가능하게 만들 때 재미가 시작됩니다.
5장 - 초보자에서 마스터 예측자로: 컨볼루션 신경망 정확도 최대화 | 온라인으로 읽기 | 피규어
우리는 TensorBoard, What-If Tool, tf-explain, TensorFlow Datasets, AutoKeras, AutoAugment를 포함한 다양한 도구의 도움을 받아 분류기가 달성할 수 있는 정확성을 최대화하는 전략을 탐구합니다. 그 과정에서 우리는 AI 작업에 어떤 매개변수가 작동하거나 작동하지 않을 수 있는지에 대한 직관을 개발하기 위해 실험을 수행합니다.
6장 - TensorFlow의 속도 및 성능 극대화: 편리한 체크리스트 | 온라인으로 읽기 | 피규어
우리는 가능한 한 많은 비효율성을 줄이고 현재 하드웨어의 가치를 극대화하기 위해 30가지 요령으로 구성된 체크리스트를 통해 교육 및 추론 속도를 하이퍼드라이브에 적용합니다.
7장 - 실용적인 도구, 팁 및 요령 | 온라인으로 읽기 | 피규어
우리는 설치, 데이터 수집, 실험 관리, 시각화, 최신 연구 추적, 이론적 기초 구축을 위한 추가 방법 탐색에 이르기까지 다양한 주제와 도구로 실무 기술을 다양화합니다. 딥러닝의.
8장 - 컴퓨터 비전용 클라우드 API: 15분 만에 설치 및 실행 | 온라인으로 읽기 | 피규어
열심히 일하지 말고 현명하게 일하세요. 우리는 Google, Microsoft, Amazon, IBM 및 Clarifai의 클라우드 AI 플랫폼을 15분 이내에 활용합니다. 기존 API로 해결되지 않은 작업의 경우 맞춤형 분류 서비스를 사용하여 코딩 없이 분류기를 교육합니다. 그런 다음 공개 벤치마크에서 서로 대결을 펼칩니다. 누가 이겼는지 놀랄 수도 있습니다.
9장 - TensorFlow Serving 및 KubeFlow를 사용하여 클라우드에서 확장 가능한 추론 제공 | 온라인으로 읽기 | 피규어
우리는 맞춤형 훈련 모델을 클라우드/온프레미스로 가져와 수천만 건의 요청을 확장 가능하게 처리합니다. Flask, Google Cloud ML Engine, TensorFlow Serving, KubeFlow를 살펴보고 노력, 시나리오, 비용 편익 분석을 보여줍니다.
10장 - TensorFlow.js 및 ml5.js를 사용하는 브라우저의 AI | 온라인으로 읽기 | 피규어
컴퓨터나 스마트폰을 사용하는 모든 개인은 동일하게 하나의 소프트웨어 프로그램, 즉 브라우저에 액세스할 수 있습니다. TensorFlow.js 및 ml5.js를 포함한 브라우저 기반 딥 러닝 라이브러리를 사용하여 모든 사용자에게 다가가세요. 객원 저자인 Zaid Alyafeai 는 신체 자세 추정, GAN(생성적 적대 신경망), Pix2Pix를 사용한 이미지 간 변환 등과 같은 기술과 작업을 서버가 아닌 브라우저 자체에서 실행하는 과정을 안내합니다. 보너스: TensorFlow.js 및 ml5.js 팀으로부터 프로젝트가 어떻게 인큐베이션되었는지 들어보세요.
11장 - Core ML을 사용한 iOS의 실시간 객체 분류 | 온라인으로 읽기 | 피규어
우리는 Core ML을 통해 Apple 생태계에 초점을 맞춰 모바일 딥 러닝 환경을 탐구합니다. 우리는 다양한 iPhone에서 모델을 벤치마킹하고, 앱 크기와 에너지 영향을 줄이는 전략, 동적 모델 배포, 기기 교육 및 전문 앱 구축 방법을 조사합니다.
12장 - Core ML 및 Create ML을 사용하는 iOS에서는 Not Hotdog | 온라인으로 읽기 | 피규어
Silicon Valley의 Not Hotdog 앱(HBO 제공)은 모바일 AI의 "Hello World"로 간주되므로 하나, 둘이 아닌 세 가지 다른 방식으로 실시간 버전을 구축하여 경의를 표합니다.
13장 - 음식을 위한 Shazam: TensorFlow Lite 및 ML Kit를 사용하여 Android 앱 개발 | 온라인으로 읽기 | 피규어
우리는 TensorFlow Lite의 도움으로 Android에 AI를 도입했습니다. 그런 다음 ML Kit(TensorFlow Lite를 기반으로 구축됨)와 Fritz를 사용하여 자체 개선 AI 앱을 구축하기 위한 엔드투엔드 개발 수명 주기를 탐색하는 크로스 플랫폼 개발을 살펴봅니다. 그 과정에서 모델 버전 관리, A/B 테스트, 성공 측정, 동적 업데이트, 모델 최적화 및 기타 주제를 살펴봅니다. 보너스: Pete Warden (모바일 및 임베디드 TensorFlow의 기술 리드)이 엣지 기기에 AI를 도입한 풍부한 경험에 대해 듣게 되었습니다.
14장 - TensorFlow 객체 감지 API를 사용하여 완벽한 고양이 탐지기 앱 구축 | 온라인으로 읽기 | 피규어
우리는 이미지 내에서 개체의 위치를 찾는 네 가지 방법을 탐색합니다. 우리는 지난 수년간 객체 감지의 발전을 살펴보고 속도와 정확성 사이의 균형을 분석합니다. 이는 군중 집계, 얼굴 감지, 자율주행차와 같은 사례 연구의 기반을 구축합니다.
15장 - 제작자 되기: 엣지에서 임베디드 AI 탐색 | 온라인으로 읽기 | 피규어
객원 저자인 Sam Sterckval은 Raspberry Pi, NVIDIA Jetson Nano, Google Coral, Intel Movidius, PYNQ-Z2 FPGA 등 처리 능력과 비용이 다양한 다양한 AI 지원 엣지 장치를 선보이며 저전력 장치에 딥 러닝을 도입했습니다. 로봇공학과 메이커 프로젝트를 위한 문. 보너스: 오픈 소스 레시피 북을 통해 사람들이 창의적인 로봇을 빠르게 구축하는 방법에 대해 NVIDIA Jetson Nano 팀 의 이야기를 들어보세요.
16장 - Keras의 엔드투엔드 딥러닝을 사용하여 자율주행차 시뮬레이션 | 온라인으로 읽기 | 피규어
Microsoft AirSim의 사실적인 시뮬레이션 환경을 사용하여 객원 저자인 Aditya Sharma 와 Mitchell Spryn은 먼저 환경 내에서 가상 자동차를 운전한 다음 AI 모델에 해당 동작을 복제하도록 교육함으로써 가상 자동차를 교육하는 방법을 안내합니다. 그 과정에서 이 장에서는 자율주행 자동차 산업에 적용할 수 있는 여러 가지 개념을 다룹니다.
17장 - 한 시간 안에 자율 자동차 구축: AWS DeepRacer를 사용한 강화 학습 | 온라인으로 읽기 | 피규어
가상 세계에서 실제 세계로 이동하는 객원 작가 Sunil Mallya는 소형 자동차인 AWS DeepRacer를 1시간 이내에 조립, 훈련 및 경주할 수 있는 방법을 보여줍니다. 그리고 강화 학습의 도움으로 자동차는 스스로 운전하는 방법을 학습하여 실수를 처벌하고 성공을 극대화합니다. 우리는 이 지식을 AI 운전 올림픽부터 RoboRace(대형 자율주행 자동차 사용)까지 경주에 적용하는 방법을 배웁니다. 보너스: Anima Anandkumar(NVIDIA) 와 Chris Anderson(DIY Robocars 창립자) 로부터 자율 주행 자동차 산업이 어디로 향하고 있는지 들어보세요.
우선, 환영합니다! 딥러닝에 대해 더 알아보기 위해 이 책과 코드를 사용하기로 결정하신 것을 기쁘게 생각합니다! 앞으로의 여정에 최선을 다하시기를 바랍니다. 저장소를 사용할 때 명심해야 할 몇 가지 사항은 다음과 같습니다.
code
폴더에 있습니다.Google Colab에 GitHub 저장소를 로드하려면 다음 지침을 따르세요. 로컬 시스템의 데이터를 사용하므로 귀하는 자신의 Google 드라이브에 액세스해야 합니다.
우리는 책 전반에 걸쳐 practicaldl
이라는 이름의 virtualenv
사용할 것입니다. 이 virtualenv
의 requirements.txt
는 루트 디렉터리에 있습니다. virtualenv
설치에 대한 도움말과 지침은 FAQ 문서의 설치 섹션에 있습니다.
CONTRIBUTING에 따라 문제를 제출해 주시면 조사하겠습니다.
@AnirudhKoul 은 유명한 AI 전문가이자 UN/TEDx 연사이며 Microsoft AI & Research의 전 과학자로 Seeing AI를 설립했습니다. Seeing AI는 iPhone 이후 시각 장애인 커뮤니티에서 가장 많이 사용되는 기술로 간주되는 경우가 많습니다. Anirudh는 Time Magazine에서 2018년 최고의 발명품 중 하나로 인정받은 Aira의 AI 및 연구 책임자로 재직하고 있습니다. 그는 수십억 명의 사용자에게 제공되는 기능을 통해 PetaByte 규모 데이터 세트에 대한 10년 이상의 생산 중심 Applied Research 경험을 제공합니다. 그는 증강현실, 로봇공학, 음성, 생산성, 접근성 등 AI 기술을 활용한 기술을 개발해 왔습니다. IEEE가 '인생을 변화시키는' 분야라고 부르는 선한 AI 분야에서의 그의 작업은 CES, FCC, MIT, Cannes Lions, American Council of the Blind로부터 상을 받았으며 UN, 세계경제포럼, 백악관 등의 행사에서 선보였습니다. , House of Lords, Netflix, National Geographic 등을 제작했으며 Justin Trudeau와 Theresa May를 비롯한 세계 지도자들의 찬사를 받았습니다.
Forbes가 선정한 30세 이하 30인 목록에 포함된 AI 연구원 @SiddhaGanju 는 Nvidia의 자율 주행 설계자입니다. NASA FDL의 AI 고문으로서 그녀는 NASA의 CAMS 프로젝트를 위한 자동화된 유성 탐지 파이프라인 구축을 도왔으며 결국 혜성을 발견하게 되었습니다. 이전에는 Deep Vision에서 리소스 제약이 있는 엣지 장치를 위한 딥 러닝 모델을 개발했습니다. 그녀의 작업 범위는 시각적 질문 응답부터 생성적 적대 네트워크(Generative Adversarial Networks), CERN의 페타바이트 규모 데이터에서 통찰력 수집에 이르기까지 다양하며 CVPR 및 NeurIPS를 포함한 최상위 컨퍼런스에서 발표되었습니다. 그녀는 CES를 포함한 여러 국제 기술 대회에서 특별 심사위원으로 활동했습니다. 기술의 다양성과 포용성을 옹호하는 그녀는 학교와 대학에서 연설하여 모든 배경의 차세대 기술에 동기를 부여하고 성장시킵니다.
@MeherKasam 은 매일 수천만 명의 사용자가 사용하는 앱을 개발한 노련한 소프트웨어 개발자입니다. 현재 Square의 iOS 개발자이고 이전에는 Microsoft와 Amazon에서 근무한 그는 Square의 POS(Point of Sale)에서 Bing iPhone 앱에 이르기까지 다양한 앱의 기능을 출시했습니다. 이전에는 Microsoft에서 근무하면서 Seeing AI 앱의 모바일 개발 책임자로 일했습니다. 이 앱은 Mobile World Congress, CES, FCC, American Council of the Blind 등으로부터 폭넓은 인정과 상을 받았습니다. 빠른 프로토타입 제작에 재능이 있는 해커인 그는 여러 해커톤에서 우승했으며 이를 널리 사용되는 제품에 포함된 기능으로 변환했습니다. 그는 또한 Global Mobile Awards 및 Edison Awards를 포함한 국제 대회의 심사위원으로도 활동하고 있습니다.
우리 코드를 사용하는 경우 우리를 인용해 주세요.
@book{Koul2019PracticalDLBook,
title={Practical Deep Learning for Cloud, Mobile and Edge: Real-World AI and Computer Vision Projects Using Python, Keras and TensorFlow},
author={Koul, A. and Ganju, S. and Kasam, M.},
isbn={9781492034865},
url={https://www.oreilly.com/library/view/practical-deep-learning/9781492034858/},
year={2019},
publisher={O'Reilly Media, Incorporated}
}