EMNLP 2021 논문의 공식 PyTorch 구현 및 EmoCause 평가 세트?
김현우, 김병창, 김건희. 감정 원인에 초점을 맞춘 공감적 반응 생성을 위한 관점 수용 및 실용론. EMNLP , 2021 [논문]
출판된 연구의 일부로 이 저장소의 자료를 사용하는 경우 다음 논문을 인용해 주시기 바랍니다.
@inproceedings { Kim:2021:empathy ,
title = { Perspective-taking and Pragmatics for Generating Empathetic Responses Focused on Emotion Causes } ,
author = { Kim, Hyunwoo and Kim, Byeongchang and Kim, Gunhee } ,
booktitle = { EMNLP } ,
year = 2021
}
우리 코드는 ParlAI 프레임워크를 기반으로 구축되었습니다. 다음과 같이 conda 환경을 생성하는 것이 좋습니다.
conda env create -f environment.yml
그리고 그것을 활성화
conda activate focused-empathy
python -m spacy download en
EmoCause 는 EmpatheticDialogues 유효 및 테스트 세트의 감정 상황에서 주석이 달린 감정 원인 단어의 데이터세트입니다. 목표는 단어 수준 레이블 없이 문장 수준 감정 레이블만 학습하여 문장 내 감정 원인 단어를 인식하는 것입니다( 즉, 약한 지도 감정 원인 인식 ). EmoCause 는 단어 수준의 원인 레이블에 대한 지도 학습을 통해 인간이 감정의 원인을 인식하지 못한다는 사실을 기반으로 합니다. 따라서 우리는 훈련 세트를 제공하지 않습니다.
EmoCause 평가 세트는 [여기]에서 다운로드할 수 있습니다.
아래 실험 명령어를 실행하면 데이터세트가 자동으로 다운로드됩니다.
#감정 | 라벨 유형 | #레이블/발언 | #말 | |
---|---|---|---|---|
Emo원인 | 32 | 단어 | 2.3 | 4.6K |
{
"original_situation": the original situations in the EmpatheticDialogues,
"tokenized_situation": tokenized situation utterances using spacy,
"emotion": emotion labels,
"conv_id": id for each corresponding conversation in EmpatheticDialogues,
"annotation": list of tuples: (emotion cause word, index),
"labels": list of strings containing the emotion cause words
}
다음 명령을 실행하면 해당 모델이 모두 자동으로 다운로드됩니다.
또한 수동 다운로드 링크도 제공합니다: [GEE] [Finetuned Blender]
EmoCause 평가 세트에서 제안된 GEE(Generative Emotion Estimator)를 평가할 수 있습니다.
python eval_emocause.py --model agents.gee_agent:GeeCauseInferenceAgent --fp16 False
미세 조정된 블렌더 위에 집중된 공감 반응을 생성하는 우리의 접근 방식을 평가할 수 있습니다(블렌더에 익숙하지 않으신가요? 여기를 참조하세요!).
python eval_empatheticdialogues.py --model agents.empathetic_gee_blender:EmpatheticBlenderAgent --model_file data/models/finetuned_blender90m/model --fp16 False --empathy-score False
--alpha 0
플래그를 추가하면 화용론 없이 블렌더가 실행됩니다. --distractor-type random
추가하여 무작위 선택 항목(일반 S1)을 사용해 볼 수도 있습니다.
해석 및 탐색 점수도 측정하려면 --empathy-score
True
로 설정하세요. EmpatheticDialogues에서 미세 조정된 RoBERTa 모델을 자동으로 다운로드합니다. 공감 점수에 대한 자세한 내용을 보려면 원본 저장소를 방문하세요.
본 연구에 유익한 논평을 해주신 익명의 심사위원님들께 감사드립니다.
본 연구는 프로젝트 번호 SRFCIT210101로 삼성전자 삼성연구지원센터의 지원을 받았습니다. 컴퓨팅 자원 및 인체 연구는 한국연구재단(NRF)의 뇌 연구 프로그램(2017M3C7A1047860)에서 지원됩니다.
vl dot snu dot ac dot kr hyw.kim 김현우에게 연락주세요.
이 저장소는 MIT 라이센스를 받았습니다. 자세한 내용은 LICENSE 파일을 참조하세요.