Antecedentes - Meme : Em 2016, um meme se tornou viral e fazia às pessoas uma pergunta que elas provavelmente nunca pensaram que seria desafiadora antes: Você consegue dizer a diferença entre essas imagens que você nunca pensou que fossem parecidas?
(fonte: Revista Elle, https://www.elle.com/culture/news/a34939/animals-or-food/)
Como dono de um Chihuahua, meu interesse se concentrou neste par:
Classificação de imagens de fundo : Uma afirmação frequentemente feita sobre algoritmos de classificação de imagens é que, embora eles possam distinguir rapidamente entre milhares de imagens com uma precisão muito boa , uma criança pode distinguir entre imagens com uma precisão muito melhor .
A questão de Chihuahua versus Blueberry Muffin fascinou-me porque – no caso dos ângulos de close selecionados para o meme – este não é o caso em que um ser humano consegue distinguir facilmente entre essas imagens.
Declaração do problema : Depois de construir um modelo de classificação de imagens que pode prever se uma imagem é de um Chihuahua ou de um Muffin de Blueberry treinada em fotos distintas com zoom reduzido, esse modelo de classificação de imagens pode prever com precisão a classificação para as desafiadoras fotos ampliadas do meme?
Comecei com uma CNN treinada do zero nas imagens raspadas. A precisão máxima que obtive foi de 85%. Em seguida, incorporei a geração de dados de imagem para aumentar o tamanho do meu treinamento. Isso não melhorou minha precisão, mas aumentou a velocidade de execução do modelo. Por fim, implementei o aprendizado por transferência e obtive uma precisão superior a 99%.