รหัส/ข้อมูลสำหรับรายงาน NAACL'19 ร่วมกันเพิ่มประสิทธิภาพความหลากหลายและความเกี่ยวข้องในการสร้างการตอบสนองของระบบประสาท
SpaceFusion เป็นกระบวนทัศน์การเรียนรู้แบบหลายงานที่ได้รับการปรับให้เป็นมาตรฐานซึ่งเสนอเพื่อจัดวางและจัดโครงสร้างพื้นที่แฝงที่ไม่มีโครงสร้างซึ่งเรียนรู้จากแบบจำลองต่างๆ ที่ได้รับการฝึกบนชุดข้อมูลที่แตกต่างกัน สิ่งที่น่าสนใจเป็นพิเศษคือการประยุกต์ใช้กับการสร้างแบบจำลองการสนทนาทางประสาท โดยที่ SpaceFusion ใช้เพื่อร่วมกันปรับความเกี่ยวข้องและความหลากหลายของการตอบสนองที่สร้างขึ้น
เอกสารเพิ่มเติม:
บทความของเราที่ NAACL'19 (ยาว ปากเปล่า)
สไลด์ที่นำเสนอในงาน NAACL'19
เราเผยแพร่บล็อก MSR เพื่อหารือเกี่ยวกับสัญชาตญาณและความหมายโดยนัย
ผลงานติดตามผลของเรา StyleFusion ที่ EMNLP'19
โมเดลการประเมิน/จัดอันดับบทสนทนาล่าสุดของเรา DialogRPT ที่ EMNLP'20
รหัสได้รับการทดสอบโดยใช้ Python 3.6 และ Keras 2.2.4
เราจัดเตรียมสคริปต์เพื่อสร้าง Reddit และประมวลผลชุดข้อมูล Switchboard รวมถึงชุดข้อมูลของเล่นใน Repo นี้เพื่อการดีบัก
โปรดตรวจสอบที่นี่เพื่อดูรายละเอียดเพิ่มเติม
วิธีฝึกโมเดล SpaceFusion: python src/main.py mtask train --data_name=toy
หากต้องการเห็นภาพพื้นที่แฝงที่เรียนรู้: python src/vis.py --data_name=toy
หากต้องการโต้ตอบกับโมเดลที่ได้รับการฝึก: python src/main.py mtask interact --data_name=toy --method=?
โดยที่วิธีการอาจเป็น greedy
rand
sampling
หรือ beam
เราใช้ rand
ในกระดาษ
เพื่อสร้างสมมติฐานสำหรับการทดสอบด้วยโมเดลที่ผ่านการฝึกอบรม: python src/main.py mtask test --data_name=toy
เพื่อประเมินสมมติฐานที่สร้างขึ้น python src/eval.py --path_hyp=? --path_ref=? --wt_len=?
ซึ่งแสดงผลความแม่นยำ การเรียกคืน และ F1 ตามที่กำหนดไว้ในรายงาน คุณอาจต้องการรันคำสั่งนี้ด้วย -len_only
ก่อนเพื่อค้นหา wt_len
ที่เหมาะสมซึ่งจะลดความแตกต่างระหว่างความยาวเฉลี่ย (จำนวนโทเค็น) ของสมมติฐานและการอ้างอิง
main.py
เป็นไฟล์หลัก
model.py
กำหนดโมเดล SpaceFusion (ดู class MTask
) และเส้นพื้นฐานบางส่วน
vis.py
กำหนดฟังก์ชันที่เราใช้เพื่อแสดงภาพและวิเคราะห์พื้นที่แฝง
dataset.py
กำหนดตัวป้อนข้อมูล
shared.py
กำหนดไฮเปอร์พารามิเตอร์เริ่มต้น
โปรดอ้างอิงเอกสาร NAACL ของเราหาก repo นี้เป็นแรงบันดาลใจให้กับงานของคุณ :)
@article{gao2019spacefusion, title={Jointly Optimizing Diversity and Relevance in Neural Response Generation}, author={Gao, Xiang and Lee, Sungjin and Zhang, Yizhe and Brockett, Chris and Galley, Michel and Gao, Jianfeng and Dolan, Bill}, journal={NAACL-HLT 2019}, year={2019} }