le document : Apprentissage contradictoire pour la génération de dialogue neuronal https://arxiv.org/pdf/1701.06547.pdf
la traduction papier en chinois :http://blog.csdn.net/liuyuemaicha/article/details/60581187
TensorFlow 0.12.0 Python 2.7
gen_data: données d'entraînement pour le modèle gen
disc_data : données d'entraînement pour le modèle de disque
disque:code sur le modèle de disque
gen : code sur le modèle de génération
utils:code sur le fonctionnement des données et la configuration du modèle
avis:
gen_data inclut chitchat.train.answer, chitchat.train.query, chitchat.dev.answer, chitchat.dev.query (quatre fichiers au total)
disc_data inclut disc.dev.answer,disc.dev.query, disc.dev.gen et disc.train.answer, disc.train.query,disc.tran.gen (six fichiers au total)
formule de données d'entraînement , une phrase, une ligne et divisée par un espace, par exemple : je ne veux pas !
python al_neural_dialogue_train.py
introduction
def principal(_):
'''
# modèle de génération de formation step_1
# gen_pre_train()
# model test
# gen_test()
# step_2 gen training data for disc
# gen_disc()
# step_3 training disc model
# disc_pre_train()
# step_4 training al model
# al_train()
# model test
# gen_test()
'''
présentation du modèle
1、Modèle de disque : rnn hiérarchique (article——Construire des systèmes de dialogue de bout en bout à l'aide de modèles de réseaux neuronaux hiérarchiques génératifs)
Modèle 2、gen : seq2seqModèle avec attention (cellule GRU)
3、Mode de récompense : Recherche Monte Carlo
4、optimal:Politique Dégradé