บทความ: การเรียนรู้ฝ่ายตรงข้ามเพื่อการสร้างบทสนทนาทางประสาทเทียม https://arxiv.org/pdf/1701.06547.pdf
แปลเอกสารเป็นภาษาจีน :http://blog.csdn.net/liuyuemaicha/article/details/60581187
เทนเซอร์โฟลว์ 0.12.0 Python 2.7
gen_data: ข้อมูลการฝึกอบรมสำหรับโมเดล gen
disc_data: ข้อมูลการฝึกอบรมสำหรับรุ่นดิสก์
disc: รหัสเกี่ยวกับรุ่นของแผ่นดิสก์
gen: รหัสเกี่ยวกับโมเดล gen
utils: รหัสเกี่ยวกับการดำเนินการข้อมูลและการกำหนดค่าโมเดล
สังเกต:
gen_data ได้แก่ chitchat.train.answer, chitchat.train.query, chitchat.dev.answer, chitchat.dev.query (ทั้งหมดสี่ไฟล์)
disc_data ได้แก่ disc.dev.answer,disc.dev.query, disc.dev.gen และ disc.train.answer, disc.train.query,disc.tran.gen (ทั้งหมดหกไฟล์)
สูตรข้อมูลการฝึก 1 ประโยค 1 แถว และแบ่งเป็นช่องว่าง เช่น ไม่อยาก !
หลาม al_neural_dialogue_train.py
การแนะนำ
หลักแน่นอน(_):
-
# step_1 โมเดลเจนการฝึกอบรม
# gen_pre_train()
# model test
# gen_test()
# step_2 gen training data for disc
# gen_disc()
# step_3 training disc model
# disc_pre_train()
# step_4 training al model
# al_train()
# model test
# gen_test()
-
การแนะนำโมเดล
1、แบบจำลองดิสก์: rnn แบบลำดับชั้น (กระดาษ——การสร้างระบบการสนทนาแบบ end-to-end โดยใช้โมเดลโครงข่ายประสาทเทียมแบบลำดับชั้นแบบกำเนิด)
รุ่น 2、gen : รุ่น seq2seq พร้อมความสนใจ (เซลล์ GRU)
3、วิธีการรับรางวัล : ค้นหามอนติคาร์โล
4、เหมาะสมที่สุด:การไล่ระดับนโยบาย