Anotasi FER+ memberikan serangkaian label baru untuk kumpulan data Emotion FER standar. Di FER+, setiap gambar telah diberi label oleh 10 pemberi tag bersumber dari banyak orang, yang memberikan kualitas kebenaran dasar yang lebih baik untuk emosi gambar diam dibandingkan label FER asli. Memiliki 10 penanda untuk setiap gambar memungkinkan peneliti memperkirakan distribusi probabilitas emosi per wajah. Hal ini memungkinkan pembuatan algoritme yang menghasilkan distribusi statistik atau keluaran multi-label, bukan keluaran label tunggal konvensional, seperti yang dijelaskan dalam: https://arxiv.org/abs/1608.01041
Berikut beberapa contoh label FER vs FER+ yang diambil dari kertas di atas (FER atas, FER+ bawah):
File label baru diberi nama fer2013new.csv dan berisi jumlah baris yang sama dengan file label fer2013.csv asli dengan urutan yang sama, sehingga Anda dapat menyimpulkan tag emosi mana yang dimiliki gambar mana. Karena kami tidak dapat menghosting konten gambar sebenarnya, silakan temukan kumpulan data FER asli di sini: https://www.kaggle.com/c/challenges-in-representation-learning-facial-expression-recognition-challenge/data
Format file CSV adalah sebagai berikut: penggunaan, netral, kebahagiaan, kejutan, kesedihan, kemarahan, jijik, ketakutan, penghinaan, tidak diketahui, NF. Kolom "penggunaan" sama dengan label FER asli untuk membedakan antara set pelatihan, pengujian publik, dan pengujian pribadi. Kolom lainnya adalah penghitungan suara untuk setiap emosi dengan penambahan unknown dan NF (Not a Face).
Kami juga menyediakan kode pelatihan dengan implementasi untuk semua mode pelatihan (mayoritas, probabilitas, entropi silang, dan multi-label) yang dijelaskan di https://arxiv.org/abs/1608.01041. Kode pelatihan menggunakan MS Cognitive Toolkit (sebelumnya CNTK) yang tersedia di: https://github.com/Microsoft/CNTK.
Setelah menginstal Cognitive Toolkit dan mengunduh kumpulan data (kita akan membahas tata letak kumpulan data selanjutnya), Anda cukup menjalankan perintah berikut untuk memulai pelatihan:
python train.py -d -m majority
python train.py -d -m probability
python train.py -d -m crossentropy
python train.py -d -m multi_target
Ada folder bernama data yang memiliki tata letak berikut:
/data
/FER2013Test
label.csv
/FER2013Train
label.csv
/FER2013Valid
label.csv
label.csv di setiap folder berisi label sebenarnya untuk setiap gambar, nama gambar dalam format berikut: ferXXXXXXXX.png, dengan XXXXXXXX adalah indeks baris dari file FER csv asli. Berikut nama beberapa gambar pertama:
fer0000000.png
fer0000001.png
fer0000002.png
fer0000003.png
Folder tidak berisi gambar sebenarnya, Anda perlu mengunduhnya dari https://www.kaggle.com/c/challenges-in-representation-learning-facial-expression-recognition-challenge/data, lalu ekstrak gambar dari file FER csv sedemikian rupa, sehingga semua gambar yang terkait dengan "Pelatihan" masuk ke folder FER2013Train, semua gambar yang terkait dengan "PublicTest" masuk ke folder FER2013Valid dan semua gambar yang terkait dengan "PrivateTest" masuk ke folder FER2013Test. Atau Anda dapat menggunakan skrip generate_training_data.py
untuk melakukan semua hal di atas untuk Anda seperti yang disebutkan di bagian selanjutnya.
Kami menyediakan skrip sederhana generate_training_data.py
dengan python yang menggunakan fer2013.csv dan fer2013new.csv sebagai input, menggabungkan kedua file CSV dan mengekspor semua gambar ke dalam file png untuk diproses oleh pelatih.
python generate_training_data.py -d -fer -ferplus
Jika Anda menggunakan label FER+ baru atau kode sampel atau bagiannya dalam penelitian Anda, harap kutip yang berikut ini:
@dalam proses{BarsoumICMI2016,
title={Melatih Jaringan Dalam untuk Pengenalan Ekspresi Wajah dengan Distribusi Label Bersumber Banyak},
penulis={Barsoum, Emad dan Zhang, Cha dan Canton Ferrer, Cristian dan Zhang, Zhengyou},
booktitle={Konferensi Internasional ACM tentang Interaksi Multimodal (ICMI)},
tahun={2016}
}