ความเป็นมา - มีม : ในปี 2016 มีมแพร่ระบาดโดยถามคำถามที่พวกเขาไม่เคยคิดว่ามันจะท้าทายมาก่อน: คุณช่วยบอกความแตกต่างระหว่างภาพเหล่านี้ที่คุณไม่เคยคิดมาก่อนว่าดูเหมือนกันได้ไหม
(ที่มา: นิตยสารแอล, https://www.elle.com/culture/news/a34939/animals-or-food/)
ในฐานะเจ้าของชิวาวา ความสนใจของฉันอยู่ที่การจับคู่นี้:
พื้นหลัง - การจัดหมวดหมู่รูปภาพ : ข้อความที่มักกล่าวถึงอัลกอริธึมการจัดหมวดหมู่รูปภาพคือ แม้ว่าพวกเขาสามารถแยกแยะระหว่างรูปภาพนับพันได้อย่างรวดเร็วด้วยความแม่นยำ ที่ค่อนข้างดี แต่เด็กก็สามารถแยกแยะระหว่างรูปภาพต่างๆ ได้ด้วย ความแม่นยำที่ดีกว่ามาก
คำถามระหว่างชิวาวากับบลูเบอร์รี่มัฟฟินทำให้ฉันทึ่ง เพราะในกรณีของมุมโคลสอัพที่เลือกไว้สำหรับมีมนั้น นี่ไม่ใช่กรณีที่มนุษย์สามารถแยกแยะระหว่างภาพเหล่านี้ได้อย่างง่ายดาย
คำชี้แจงปัญหา : หลังจากสร้างแบบจำลองการจัดหมวดหมู่รูปภาพที่สามารถคาดเดาได้ว่ารูปภาพนั้นเป็นของชิวาวาหรือมัฟฟินบลูเบอร์รี่ที่ผ่านการฝึกฝนในการซูมภาพที่แตกต่างกันอย่างชัดเจนแล้ว โมเดลการจัดหมวดหมู่รูปภาพนั้นสามารถทำนายการจัดหมวดหมู่สำหรับภาพถ่ายที่ซูมเข้าที่ท้าทายจากมีมได้อย่างแม่นยำหรือไม่
ฉันเริ่มต้นด้วยการฝึกอบรม CNN ตั้งแต่เริ่มต้นกับภาพที่คัดลอกมา ความแม่นยำสูงสุดที่ฉันรวบรวมได้จากสิ่งนี้คือ 85% จากนั้น ฉันจึงรวมการสร้างข้อมูลรูปภาพเพื่อเพิ่มขนาดการฝึกของฉัน สิ่งนี้ไม่ได้ปรับปรุงความแม่นยำของฉัน แต่เพิ่มความเร็วในการรันโมเดล ในที่สุด ฉันปรับใช้ Transfer Learning และได้รับความแม่นยำ >99%