توفر التعليقات التوضيحية FER+ مجموعة من التصنيفات الجديدة لمجموعة بيانات Emotion FER القياسية. في FER+، تم تصنيف كل صورة بواسطة 10 علامات تمييز من مصادر جماعية، والتي توفر حقيقة أساسية ذات جودة أفضل لمشاعر الصورة الثابتة مقارنة بعلامات FER الأصلية. إن وجود 10 علامات لكل صورة يمكّن الباحثين من تقدير توزيع احتمالية المشاعر لكل وجه. يتيح ذلك إنشاء خوارزميات تنتج توزيعات إحصائية أو مخرجات متعددة التصنيفات بدلاً من المخرجات التقليدية أحادية التسمية، كما هو موضح في: https://arxiv.org/abs/1608.01041
فيما يلي بعض الأمثلة على تسميات FER vs FER+ المستخرجة من الورقة المذكورة أعلاه (FER أعلى، FER+ أسفل):
يُسمى ملف التسمية الجديد Fer2013new.csv ويحتوي على نفس عدد الصفوف الموجودة في ملف التسمية Fer2013.csv الأصلي بنفس الترتيب، بحيث يمكنك استنتاج علامة العاطفة التي تنتمي إلى أي صورة. نظرًا لأننا لا نستطيع استضافة محتوى الصورة الفعلي، يرجى العثور على مجموعة بيانات FER الأصلية هنا: https://www.kaggle.com/c/challenges-in-representation-learning-facial-expression-recognition-challenge/data
تنسيق ملف CSV هو كما يلي: استخدام، محايد، سعادة، مفاجأة، حزن، غضب، اشمئزاز، خوف، ازدراء، غير معروف، NF. "استخدام" الأعمدة هو نفس ملصق FER الأصلي للتمييز بين التدريب والاختبار العام ومجموعات الاختبار الخاصة. الأعمدة الأخرى هي عدد الأصوات لكل عاطفة مع إضافة المجهول وNF (ليس وجهًا).
نوفر أيضًا رمزًا تدريبيًا مع التنفيذ لجميع أوضاع التدريب (الأغلبية، والاحتمالية، والإنتروبيا المتقاطعة، والعلامات المتعددة) الموضحة في https://arxiv.org/abs/1608.01041. يستخدم رمز التدريب مجموعة أدوات MS Cognitive Toolkit (المعروفة سابقًا باسم CNTK) والمتوفرة في: https://github.com/Microsoft/CNTK.
بعد تثبيت مجموعة الأدوات المعرفية وتنزيل مجموعة البيانات (سنناقش تخطيط مجموعة البيانات بعد ذلك)، يمكنك ببساطة تشغيل ما يلي لبدء التدريب:
python train.py -d -m majority
python train.py -d -m probability
python train.py -d -m crossentropy
python train.py -d -m multi_target
يوجد مجلد اسمه data يحتوي على التخطيط التالي:
/data
/FER2013Test
label.csv
/FER2013Train
label.csv
/FER2013Valid
label.csv
يحتوي label.csv في كل مجلد على الملصق الفعلي لكل صورة، واسم الصورة بالتنسيق التالي: FerXXXXXXXX.png، حيث XXXXXXX هو فهرس الصف لملف FER csv الأصلي. إذن إليكم أسماء الصور القليلة الأولى:
fer0000000.png
fer0000001.png
fer0000002.png
fer0000003.png
لا تحتوي المجلدات على الصور الفعلية، ستحتاج إلى تنزيلها من https://www.kaggle.com/c/challenges-in-representation-learning-facial-expression-recognition-challenge/data، ثم قم باستخراج الملف الصور من ملف FER csv بحيث تنتقل جميع الصور المقابلة لـ "التدريب" إلى مجلد FER2013Train، وتنتقل جميع الصور المقابلة لـ "PublicTest" إلى FER2013مجلد صالح وجميع الصور المقابلة لـ "PrivateTest" انتقل إلى مجلد FER2013Test. أو يمكنك استخدام البرنامج النصي generate_training_data.py
للقيام بكل ما سبق نيابةً عنك كما هو مذكور في القسم التالي.
نحن نقدم برنامجًا نصيًا بسيطًا generate_training_data.py
في لغة بايثون يأخذ Fer2013.csv و fer2013new.csv كمدخلات، ويدمج كلا ملفي CSV ويصدر جميع الصور إلى ملفات png ليقوم المدرب بمعالجتها.
python generate_training_data.py -d -fer -ferplus
إذا كنت تستخدم علامة FER+ الجديدة أو نموذج التعليمات البرمجية أو جزءًا منه في بحثك، فيرجى ذكر ما يلي:
@inproceedings{بارصومICMI2016,
title={تدريب الشبكات العميقة للتعرف على تعبيرات الوجه من خلال توزيع الملصقات من مصادر جماعية},
المؤلف={برصوم، عماد وتشانغ، تشا وكانتون فيرير، كريستيان وتشانغ، زينجيو}،
booktitle={مؤتمر ACM الدولي حول التفاعل متعدد الوسائط (ICMI)}،
العام={2016}
}