FER+ 註釋為標準 Emotion FER 資料集提供了一組新標籤。在 FER+ 中,每張影像都由 10 個眾包標記器標記,與原始 FER 標籤相比,這些標記器為靜態影像情緒提供了更好品質的地面實況。每張影像有 10 個標記器,使研究人員能夠估計每張臉的情緒機率分佈。這允許建立產生統計分佈或多標籤輸出而不是傳統的單標籤輸出的演算法,如下所述:https://arxiv.org/abs/1608.01041
以下是從上述論文中提取的 FER 與 FER+ 標籤的一些範例(FER 頂部、FER+ 底部):
新標籤檔案名為fer2013new.csv ,包含與原始fer2013.csv標籤檔案相同的行數和相同的順序,以便您推斷哪個情緒標籤屬於哪個影像。由於我們無法託管實際的圖像內容,請在此處找到原始 FER 資料集:https://www.kaggle.com/c/challenges-in-representation-learning-facial-express-recognition-challenge/data
CSV檔案的格式如下:用法、中立、幸福、驚訝、悲傷、憤怒、厭惡、恐懼、輕視、未知、NF。 「使用」列與原始 FER 標籤相同,用於區分訓練、公共測試和私人測試集。其他欄位是每種情緒的投票數,加上未知和 NF(不是一張臉)。
我們還提供了一個訓練代碼,可實現 https://arxiv.org/abs/1608.01041 中所述的所有訓練模式(多數、機率、交叉熵和多重標籤)。訓練程式碼使用 MS Cognitive Toolkit(原名 CNTK),網址為:https://github.com/Microsoft/CNTK。
安裝認知工具包並下載資料集(我們接下來將討論資料集佈局)後,您只需執行以下命令即可開始訓練:
python train.py -d -m majority
python train.py -d -m probability
python train.py -d -m crossentropy
python train.py -d -m multi_target
有一個名為 data 的資料夾,其佈局如下:
/data
/FER2013Test
label.csv
/FER2013Train
label.csv
/FER2013Valid
label.csv
每個資料夾中的label.csv包含每個影像的實際標籤,影像名稱的格式如下:ferXXXXXXXX.png,其中XXXXXXXX是原始FER csv檔案的行索引。這是前幾張圖像的名稱:
fer0000000.png
fer0000001.png
fer0000002.png
fer0000003.png
這些資料夾不包含實際圖像,您需要從 https://www.kaggle.com/c/challenges-in-representation-learning-facial-express-recognition-challenge/data 下載它們,然後提取以這種方式從FER csv 檔案擷取影像,與「Training」對應的所有影像都轉到FER2013Train 資料夾,與「PublicTest」對應的所有影像都轉到FER2013Valid 資料夾,與「PrivateTest」對應的所有影像都轉到FER2013Test 資料夾。或者您可以使用generate_training_data.py
腳本為您執行上述所有操作,如下一節所述。
我們在Python中提供了一個簡單的腳本generate_training_data.py
,它將fer2013.csv和fer2013new.csv作為輸入,合併兩個CSV檔案並將所有影像匯出為png檔案供訓練器處理。
python generate_training_data.py -d -fer -ferplus
如果您在研究中使用新的 FER+ 標籤或範例程式碼或其部分內容,請引用以下內容:
@inproceedings{BarsoumICMI2016,
title={利用眾包標籤分佈訓練深度網路進行臉部表情辨識},
作者={Barsoum、Emad 與Zhang、Cha 與Canton Ferrer、Cristian 與Zhang、Zhengyou},
booktitle={ACM 國際多模態互動會議(ICMI)},
年={2016}
}