배경 - 밈(Meme) : 2016년에 사람들에게 전에는 결코 어려울 것이라고 생각하지 못했던 질문을 던진 밈이 입소문을 냈습니다. 이전에는 비슷하다고 생각한 적이 없는 이 이미지들의 차이점을 알 수 있습니까?
(출처: 엘르 매거진, https://www.elle.com/culture/news/a34939/animals-or-food/)
치와와의 주인으로서 나의 관심은 다음과 같은 조합에 집중되었습니다.
배경-이미지 분류 : 이미지 분류 알고리즘에 관해 자주 언급되는 말은 이 알고리즘이 수천 장의 이미지를 아주 좋은 정확도로 신속하게 구별할 수 있지만 어린이는 훨씬 더 정확하게 이미지를 구별할 수 있다는 것입니다.
치와와와 블루베리 머핀의 질문이 나를 매료시켰습니다. 왜냐하면 밈을 위해 선택된 특정 클로즈업 각도의 경우 인간이 이러한 이미지를 쉽게 구별할 수 있는 경우가 아니기 때문입니다.
문제 설명 : 이미지가 완전히 다른 축소된 사진에 대해 훈련된 치와와인지 블루베리 머핀인지 예측할 수 있는 이미지 분류 모델을 구축한 후 해당 이미지 분류 모델이 밈에서 확대된 까다로운 사진에 대한 분류를 정확하게 예측할 수 있습니까?
나는 긁힌 이미지에 대해 처음부터 훈련된 CNN으로 시작했습니다. 제가 수집한 최대 정확도는 85%였습니다. 그런 다음 이미지 데이터 생성을 통합하여 훈련 규모를 늘렸습니다. 이로 인해 정확도가 향상되지는 않았지만 모델 실행 속도가 향상되었습니다. 마지막으로 전이 학습을 구현하여 99% 이상의 정확도를 달성했습니다.