الورقة: التعلم العدائي لتوليد الحوار العصبي https://arxiv.org/pdf/1701.06547.pdf
الترجمة الورقية باللغة الصينية :http://blog.csdn.net/liuyuemaicha/article/details/60581187
TensorFlow 0.12.0 بيثون 2.7
gen_data: بيانات التدريب للنموذج العام
disk_data: بيانات التدريب لنموذج القرص
القرص: رمز حول نموذج القرص
الجنرال: رمز حول نموذج الجنرال
utils: رمز حول تشغيل البيانات وتكوين النموذج
يلاحظ:
تتضمن gen_data chitchat.train.answer وchitchat.train.query وchitchat.dev.answer وchitchat.dev.query (إجمالي أربعة ملفات)
تتضمن بيانات القرص disk.dev.answer وdisc.dev.query وdisc.dev.gen وdisc.train.answer وdisc.train.query وdisc.tran.gen (إجمالي ستة ملفات)
صيغة بيانات التدريب جملة واحدة وصف واحد ومقسمة بمسافة، على سبيل المثال: لا أريد ذلك!
بايثون al_neural_dialogue_train.py
مقدمة
تعريف الرئيسي (_):
'''
#step_1 نموذج التدريب العام
# gen_pre_train()
# model test
# gen_test()
# step_2 gen training data for disc
# gen_disc()
# step_3 training disc model
# disc_pre_train()
# step_4 training al model
# al_train()
# model test
# gen_test()
'''
مقدمة النموذج
1、نموذج القرص: RNN الهرمي (الورق —— بناء أنظمة حوار شاملة باستخدام نماذج الشبكة العصبية الهرمية التوليدية)
2. النموذج العام: نموذج seq2seq مع الاهتمام (خلية GRU)
3、طريقة المكافأة: بحث مونت كارلو
4 、 الأمثل: التدرج في السياسة