Предыстория — Мем : В 2016 году вирусным стал мем, в котором людям задавался вопрос, который, скорее всего, никогда раньше не казался им сложным: можете ли вы отличить эти изображения, которые вам никогда раньше не казались похожими?
(источник: журнал Elle, https://www.elle.com/cultural/news/a34939/animals-or-food/)
Как владелец чихуахуа, мой интерес сосредоточился на этой паре:
Классификация фона и изображения . Об алгоритмах классификации изображений часто говорят, что, хотя они могут быстро различать тысячи изображений с довольно хорошей точностью, ребенок может различать изображения с гораздо большей точностью .
Вопрос о чихуахуа и черничном маффине очаровал меня, потому что — в случае с конкретными ракурсами, выбранными для мема, — это не тот случай, когда человек может легко различить эти изображения.
Постановка задачи : после создания модели классификации изображений, которая может предсказать, принадлежит ли изображение чихуахуа или черничному маффину, обученной на сильно уменьшенных фотографиях, может ли эта модель классификации изображений точно предсказать классификацию сложных увеличенных фотографий из мема?
Я начал с CNN, обученного с нуля на извлеченных изображениях. Максимальная точность, которую я получил из этого, составила 85%. Затем я включил генерацию данных изображений, чтобы увеличить размер обучения. Это не улучшило мою точность, но увеличило скорость запуска модели. Наконец, я внедрил трансферное обучение и достиг точности> 99%.