Latar Belakang - Meme : Pada tahun 2016, sebuah meme menjadi viral yang menanyakan pertanyaan yang mungkin tidak pernah terpikirkan sebelumnya oleh orang-orang: Bisakah kamu membedakan gambar-gambar yang sebelumnya kamu pikir mirip?
(sumber: Majalah Elle, https://www.elle.com/culture/news/a34939/animals-or-food/)
Sebagai pemilik seekor Chihuahua, minat saya tertuju pada pasangan ini:
Latar Belakang - Klasifikasi Gambar : Pernyataan yang sering dibuat tentang algoritme klasifikasi gambar adalah bahwa meskipun algoritma tersebut dapat dengan cepat membedakan ribuan gambar dengan akurasi yang cukup baik , seorang anak dapat membedakan gambar dengan akurasi yang jauh lebih baik .
Pertanyaan tentang Chihuahua versus Blueberry Muffin membuat saya terpesona karena--dalam kasus sudut close up tertentu yang dipilih untuk meme--ini bukanlah kasus di mana manusia dapat dengan mudah membedakan gambar-gambar ini.
Pernyataan Masalah : Setelah membuat model klasifikasi gambar yang dapat memprediksi apakah suatu gambar adalah Chihuahua atau Blueberry Muffin yang dilatih untuk memperkecil foto yang berbeda, dapatkah model klasifikasi gambar tersebut secara akurat memprediksi klasifikasi untuk foto yang diperbesar dan diperbesar dari meme?
Saya mulai dengan CNN yang dilatih dari awal pada gambar-gambar yang tergores. Akurasi maksimum yang saya kumpulkan dari ini adalah 85%. Saya kemudian memasukkan Pembuatan Data Gambar untuk meningkatkan ukuran pelatihan saya. Ini tidak meningkatkan akurasi saya tetapi meningkatkan kecepatan menjalankan model. Akhirnya, saya menerapkan pembelajaran transfer dan mencapai akurasi >99%.