Este é o repositório de código oficial da Publicação O'Reilly, Aprendizado profundo prático para nuvem, dispositivos móveis e Edge por Anirudh Koul, Siddha Ganju e Meher Kasam. ** Apresentado como recurso de aprendizagem no site oficial da Keras ** |
---|
[On-line no Safari] | [Compre na Amazon] | [Online no Google Livros] | [Site do livro] | [Apresentação no Slideshare]
Quer você seja um engenheiro de software que deseja entrar no mundo do aprendizado profundo, um cientista de dados veterano ou um hobby com o simples sonho de criar o próximo aplicativo viral de IA, você deve estar se perguntando por onde devo começar? Este guia passo a passo ensina como criar aplicativos práticos de aprendizagem profunda para nuvem, dispositivos móveis, navegadores e dispositivos de borda usando uma abordagem prática.
Contando com anos de experiência no setor transformando pesquisas de aprendizagem profunda em aplicações premiadas, Anirudh Koul, Siddha Ganju e Meher Kasam orientam você no processo de conversão de uma ideia em algo que as pessoas no mundo real possam usar.
Capítulo 1 - Explorando o cenário da inteligência artificial | Leia on-line | Figuras
Fazemos um tour por esse cenário em evolução, desde a década de 1950 até hoje, e analisamos os ingredientes que compõem uma receita perfeita de aprendizado profundo, nos familiarizamos com a terminologia e os conjuntos de dados comuns da IA e damos uma olhada no mundo da IA responsável.
Capítulo 2 - O que está na imagem: Classificação de imagens com Keras | Leia on-line | Figuras
Mergulhamos no mundo da classificação de imagens em apenas cinco linhas de código Keras. Em seguida, aprendemos no que as redes neurais estão prestando atenção ao fazer previsões sobrepondo mapas de calor em vídeos. Bônus: ouvimos a jornada pessoal motivadora de François Chollet , o criador de Keras, ilustrando o impacto que um único indivíduo pode ter.
Capítulo 3 - Gatos versus Cães: Transfira o Aprendizado em 30 Linhas com Keras | Leia on-line | Figuras
Usamos a aprendizagem por transferência para reutilizar uma rede previamente treinada em uma nova tarefa de classificação personalizada para obter precisão quase de última geração em questão de minutos. Em seguida, dividimos os resultados para entender quão bem está a classificação. Ao longo do caminho, construímos um pipeline comum de aprendizado de máquina, que será reaproveitado ao longo do livro. Bônus: ouvimos Jeremy Howard , cofundador da fast.ai, sobre como centenas de milhares de estudantes usam a aprendizagem por transferência para iniciar sua jornada de IA.
Capítulo 4 - Construindo um mecanismo de pesquisa reversa de imagens: entendendo os embeddings | Leia on-line | Figuras
Assim como a Pesquisa reversa de imagens do Google, exploramos como é possível usar embeddings – uma representação contextual de uma imagem para encontrar imagens semelhantes em menos de dez linhas. E então a diversão começa quando exploramos diferentes estratégias e algoritmos para acelerar isso em grande escala, de milhares a vários milhões de imagens, e torná-las pesquisáveis em microssegundos.
Capítulo 5 - Do Preditor Iniciante ao Mestre: Maximizando a Precisão da Rede Neural Convolucional | Leia on-line | Figuras
Exploramos estratégias para maximizar a precisão que nosso classificador pode alcançar, com a ajuda de uma variedade de ferramentas, incluindo TensorBoard, What-If Tool, tf-explain, TensorFlow Datasets, AutoKeras, AutoAugment. Ao longo do caminho, conduzimos experimentos para desenvolver uma intuição sobre quais parâmetros podem ou não funcionar para sua tarefa de IA.
Capítulo 6 - Maximizando a velocidade e o desempenho do TensorFlow: uma lista de verificação útil | Leia on-line | Figuras
Levamos a velocidade do treinamento e da inferência ao hiperdrive, passando por uma lista de verificação de 30 truques para reduzir o máximo possível de ineficiências e maximizar o valor do seu hardware atual.
Capítulo 7 - Ferramentas práticas, dicas e truques | Leia on-line | Figuras
Diversificamos nossas habilidades práticas em uma variedade de tópicos e ferramentas, que vão desde instalação, coleta de dados, gerenciamento de experimentos, visualizações, acompanhamento do estado da arte em pesquisa até a exploração de novos caminhos para a construção de fundamentos teóricos. de aprendizagem profunda.
Capítulo 8 - APIs de nuvem para visão computacional: instaladas e funcionando em 15 minutos | Leia on-line | Figuras
Trabalhe de forma inteligente, não difícil. Utilizamos o poder das plataformas de IA em nuvem do Google, Microsoft, Amazon, IBM e Clarifai em menos de 15 minutos. Para tarefas não resolvidas com APIs existentes, usamos serviços de classificação personalizados para treinar classificadores sem codificação. E então os colocamos uns contra os outros em um benchmark aberto, você pode se surpreender com quem ganhou.
Capítulo 9 – Serviço de inferência escalonável na nuvem com TensorFlow Serving e KubeFlow | Leia on-line | Figuras
Levamos nosso modelo treinado personalizado para a nuvem/local para atender de forma escalonável de dezenas a milhões de solicitações. Exploramos Flask, Google Cloud ML Engine, TensorFlow Serving e KubeFlow, apresentando o esforço, o cenário e a análise de custo-benefício.
Capítulo 10 – IA no navegador com TensorFlow.js e ml5.js | Leia on-line | Figuras
Cada indivíduo que usa um computador ou smartphone de maneira uniforme tem acesso a um programa de software: seu navegador. Alcance todos esses usuários com bibliotecas de aprendizagem profunda baseadas em navegador, incluindo TensorFlow.js e ml5.js. O autor convidado Zaid Alyafeai nos orienta através de técnicas e tarefas como estimativa de pose corporal, redes adversárias generativas (GANs), tradução de imagem para imagem com Pix2Pix e muito mais, rodando não em um servidor, mas no próprio navegador. Bônus: ouça as equipes do TensorFlow.js e ml5.js sobre como os projetos foram incubados.
Capítulo 11 - Classificação de objetos em tempo real no iOS com Core ML | Leia on-line | Figuras
Exploramos o cenário do aprendizado profundo em dispositivos móveis, com foco no ecossistema da Apple com Core ML. Comparamos modelos em diferentes iPhones, investigamos estratégias para reduzir o tamanho do aplicativo e o impacto energético, implantação dinâmica de modelos, treinamento no dispositivo e como os aplicativos profissionais são criados.
Capítulo 12 - Não Hotdog no iOS com Core ML e Create ML | Leia on-line | Figuras
O aplicativo Not Hotdog do Vale do Silício (da HBO) é considerado o “Hello World” da IA móvel, por isso prestamos homenagem ao construir uma versão em tempo real não de uma, não de duas, mas de três maneiras diferentes.
Capítulo 13 - Shazam for Food: desenvolvendo aplicativos Android com TensorFlow Lite e ML Kit | Leia on-line | Figuras
Trazemos IA para o Android com a ajuda do TensorFlow Lite. Em seguida, analisamos o desenvolvimento de plataforma cruzada usando o ML Kit (que é desenvolvido com base no TensorFlow Lite) e Fritz para explorar o ciclo de vida de desenvolvimento de ponta a ponta para construir um aplicativo de IA com autoaperfeiçoamento. Ao longo do caminho, analisamos o versionamento de modelos, testes A/B, medição de sucesso, atualizações dinâmicas, otimização de modelos e outros tópicos. Bônus: ouviremos sobre a rica experiência de Pete Warden (líder técnico de TensorFlow móvel e incorporado) em levar IA a dispositivos de ponta.
Capítulo 14 - Construindo o aplicativo Purrfect Cat Locator com API TensorFlow Object Detection | Leia on-line | Figuras
Exploramos quatro métodos diferentes para localizar a posição de objetos nas imagens. Damos uma olhada na evolução da detecção de objetos ao longo dos anos e analisamos as compensações entre velocidade e precisão. Isso cria a base para estudos de caso, como contagem de multidões, detecção de rostos e carros autônomos.
Capítulo 15 - Tornando-se um Criador: Explorando a IA Incorporada no Edge | Leia on-line | Figuras
O autor convidado Sam Sterckval traz aprendizado profundo para dispositivos de baixo consumo de energia enquanto apresenta uma variedade de dispositivos de borda com capacidade de IA com poder de processamento e custo variados, incluindo Raspberry Pi, NVIDIA Jetson Nano, Google Coral, Intel Movidius, PYNQ-Z2 FPGA, abrindo o portas para projetos de robótica e maker. Bônus: ouça a equipe do NVIDIA Jetson Nano sobre como as pessoas estão construindo robôs criativos rapidamente a partir de seu livro de receitas de código aberto.
Capítulo 16 - Simulando um carro autônomo usando aprendizado profundo de ponta a ponta com Keras | Leia on-line | Figuras
Usando o ambiente de simulação fotorrealista do Microsoft AirSim, os autores convidados Aditya Sharma e Mitchell Spryn nos guiam no treinamento de um carro virtual, dirigindo-o primeiro dentro do ambiente e depois ensinando um modelo de IA para replicar seu comportamento. Ao longo do caminho, este capítulo aborda uma série de conceitos que são aplicáveis na indústria automobilística autônoma.
Capítulo 17 – Construindo um carro autônomo em menos de uma hora: aprendizado por reforço com AWS DeepRacer | Leia on-line | Figuras
Passando do mundo virtual para o físico, o autor convidado Sunil Mallya mostra como o AWS DeepRacer, um carro em miniatura, pode ser montado, treinado e pilotado em menos de uma hora. E com a ajuda do aprendizado por reforço, o carro aprende a dirigir sozinho, penalizando os erros e maximizando o sucesso. Aprendemos como aplicar esse conhecimento a corridas desde as Olimpíadas de condução com IA até RoboRace (usando carros autônomos de tamanho normal). Bônus: ouça Anima Anandkumar (NVIDIA) e Chris Anderson (fundador da DIY Robocars) sobre o rumo que a indústria automotiva autônoma está tomando.
Em primeiro lugar, seja bem-vindo! Estamos felizes que você tenha decidido usar o livro e o código para aprender mais sobre Deep Learning! Desejamos a você o melhor para sua jornada adiante. Aqui estão algumas coisas que você deve ter em mente ao usar o repositório.
code
.Siga estas instruções para carregar o repositório GitHub no Google Colab. Lembre-se de que você precisará de acesso ao seu próprio Google Drive, pois usaremos dados de um sistema local.
Usaremos um virtualenv
chamado practicaldl
ao longo do livro. Os requirements.txt
para este virtualenv
estão no diretório raiz. Ajuda e instruções para instalar virtualenv
estão na seção Instalação no documento FAQ.
Registre um problema de acordo com CONTRIBUTING e nós investigaremos.
@AnirudhKoul é um notável especialista em IA, palestrante da UN/TEDx e ex-cientista da Microsoft AI & Research, onde fundou o Seeing AI, frequentemente considerada a tecnologia mais usada pela comunidade cega depois do iPhone. Anirudh atua como chefe de IA e pesquisa na Aira, reconhecida pela Time Magazine como uma das melhores invenções de 2018. Com recursos enviados para um bilhão de usuários, ele traz mais de uma década de experiência em pesquisa aplicada orientada à produção em conjuntos de dados em escala PetaByte. Ele vem desenvolvendo tecnologias utilizando técnicas de IA para Realidade Aumentada, Robótica, Fala, Produtividade e Acessibilidade. Seu trabalho no campo AI for Good, que o IEEE chamou de 'mudança de vida', recebeu prêmios da CES, FCC, MIT, Cannes Lions, Conselho Americano de Cegos, exibido em eventos da ONU, Fórum Econômico Mundial, Casa Branca , House of Lords, Netflix, National Geographic e elogiado por líderes mundiais, incluindo Justin Trudeau e Theresa May.
@SiddhaGanju , um pesquisador de IA que a Forbes incluiu em sua lista de 30 com menos de 30 anos, é arquiteto autônomo na Nvidia. Como consultora de IA da NASA FDL, ela ajudou a construir um pipeline automatizado de detecção de meteoros para o projeto CAMS da NASA, que acabou descobrindo um cometa. Anteriormente na Deep Vision, ela desenvolveu modelos de aprendizagem profunda para dispositivos de borda com restrição de recursos. Seu trabalho abrange desde respostas visuais a perguntas até redes adversárias generativas até a coleta de insights de dados em escala de petabytes do CERN e foi publicado em conferências de alto nível, incluindo CVPR e NeurIPS. Ela atuou como membro do júri em diversas competições internacionais de tecnologia, incluindo a CES. Como defensora da diversidade e da inclusão na tecnologia, ela dá palestras em escolas e faculdades para motivar e desenvolver uma nova geração de tecnologias de todas as origens.
@MeherKasam é um desenvolvedor de software experiente com aplicativos usados por dezenas de milhões de usuários todos os dias. Atualmente desenvolvedor iOS na Square e tendo trabalhado anteriormente na Microsoft e na Amazon, ele lançou recursos para uma variedade de aplicativos, desde o ponto de venda da Square até o aplicativo Bing para iPhone. Anteriormente, ele trabalhou na Microsoft, onde foi líder de desenvolvimento móvel do aplicativo Seeing AI, que recebeu amplo reconhecimento e prêmios do Mobile World Congress, CES, FCC e do American Council of the Blind, para citar alguns. Um hacker de coração com talento para prototipagem rápida, ele ganhou vários hackathons e os converteu em recursos fornecidos em produtos amplamente utilizados. Ele também atua como jurado de competições internacionais, incluindo Global Mobile Awards e Edison Awards.
Por favor, cite-nos se você usar nosso código.
@book{Koul2019PracticalDLBook,
title={Practical Deep Learning for Cloud, Mobile and Edge: Real-World AI and Computer Vision Projects Using Python, Keras and TensorFlow},
author={Koul, A. and Ganju, S. and Kasam, M.},
isbn={9781492034865},
url={https://www.oreilly.com/library/view/practical-deep-learning/9781492034858/},
year={2019},
publisher={O'Reilly Media, Incorporated}
}