статья: Состязательное обучение для генерации нейронного диалога https://arxiv.org/pdf/1701.06547.pdf
перевод статьи на китайский язык: http://blog.csdn.net/liuyuemaicha/article/details/60581187
TensorFlow 0.12.0 Python 2.7
gen_data: обучающие данные для модели генерации.
disk_data: данные обучения для модели диска.
диск: код модели диска
gen: код модели поколения
utils: код работы с данными и конфигурации модели.
уведомление:
gen_data включает chitchat.train.answer, chitchat.train.query, chitchat.dev.answer, chitchat.dev.query (всего четыре файла)
Disc_data включает в себя Disc.dev.ответ, Disc.dev.query, Disc.dev.gen и Disc.train.ответ, Disc.train.query, Disc.tran.gen (всего шесть файлов)
формула обучающих данных: одно предложение, одна строка, разделенная пробелом, например: я не хочу!
python al_neural_dialogue_train.py
введение
защита основного(_):
'''
# шаг_1 обучающая модель
# gen_pre_train()
# model test
# gen_test()
# step_2 gen training data for disc
# gen_disc()
# step_3 training disc model
# disc_pre_train()
# step_4 training al model
# al_train()
# model test
# gen_test()
'''
введение модели
1、модель диска: иерархическая rnn (документ — построение сквозных диалоговых систем с использованием генеративных иерархических моделей нейронных сетей)
2. Модель поколения: модель seq2seq с вниманием (ячейка GRU)
3. Способ вознаграждения: Поиск по Монте-Карло.
4. Оптимальный: градиент политики.