Adversarial Learning for Generative Conversational Agents herunterladen – Adversarial Learning for Generative Conversational Agents Quellcode herunterladen

Adversarial Learning for Generative Conversational Agents

AI-Quellcode

versarial Learning for Generative Conversational Agents

Herunterladen

Konfrontatives Lernen für generative Konversationsagenten

Dieses Repository enthält eine neue gegnerische Trainingsmethode für unseren Generative Conversational Agent (GCA).

Weitere Details zu dieser neuen Trainingsmethode finden Sie im Artikel Oswaldo Ludwig, „End-to-end Adversarial Learning for Generative Conversational Agents“, arXiv:1711.10122 cs.CL, Nov. 2017. Im Falle einer Veröffentlichung unter Verwendung von Ideen oder Teilen davon Code aus diesem Repository, bitte zitieren Sie dieses Dokument.

Unsere Methode geht davon aus, dass die GCA ein Generator ist, der darauf abzielt, einen Diskriminator auszutricksen, der Dialoge als von Menschen oder Maschinen generiert bezeichnet. In unserem Ansatz führt der Diskriminator eine Klassifizierung auf Token-Ebene durch, dh er gibt an, ob der aktuelle Token von Menschen oder Maschinen generiert wurde. Dazu erhält der Diskriminator auch die Kontextäußerungen (die Dialoghistorie) und die unvollständige Antwort bis zum aktuellen Token als Input. Dieser neue Ansatz ermöglicht das End-to-End-Training durch Backpropagation. Ein Selbstgesprächsprozess ermöglicht die Erstellung eines Satzes generierter Daten mit mehr Diversität für das gegnerische Training. Dieser Ansatz verbessert die Leistung bei Fragen, die nichts mit den Trainingsdaten zu tun haben.

Das hier verfügbare trainierte Modell verwendete einen Datensatz, der aus Dialogen von Online-Englischkursen gesammelt wurde und hier verfügbar ist.

Unser GCA-Modell kann durch das folgende Flussdiagramm erklärt werden:

Alt-Tag

während der folgende Pseudocode unseren GCA-Algorithmus erklärt:

Alt-Tag

Unser neues End-to-End-Gegnertraining kann durch das folgende Keras-Modell (implementiert in der Datei train_bot_GAN.py) erklärt werden, das aus dem Generator und dem Diskriminator besteht. Die gelben Blöcke gehören zum GCA (dem Generator), während die grünen Blöcke zum Diskriminator gehören. Die weißen Blöcke werden zwischen Generator und Diskriminator geteilt:

Alt-Tag

während der folgende Pseudocode den neuen Algorithmus erklärt (siehe den Artikel für die Definition der Variablen):

Alt-Tag

So chatten Sie mit den vorab trainierten Modellen:

Laden Sie die Python-Datei „conversation_GAN.py“, die Vokabeldatei „vocabulary_movie“ und die Nettogewichte „my_model_weights20.h5“ (trainiert durch Lehrererzwingung) und „my_model_weights.h5“ (trainiert durch die neue kontradiktorische Methode) herunter hier gefunden;
Führen Sie „conversation_GAN.py“ aus.

So bewerten Sie Dialogzeilen mit dem vorab trainierten Diskriminator:

Laden Sie die Python-Datei „run_discriminator_GAN.py“, die Vokabeldatei „vocabulary_movie“ und die Nettogewichte des Diskriminators „my_model_weights_discriminator.h5“ herunter, die hier zu finden sind;
Führen Sie run_discriminator_GAN.py aus.

So trainieren Sie Ende-zu-Ende mit der neuen kontradiktorischen Methode:

Laden Sie hier alle Dateien herunter;
Laden Sie den Glove-Ordner „glove.6B“ herunter und fügen Sie diesen Ordner in das Verzeichnis des Chatbots ein (diesen Ordner finden Sie hier). Dieser Algorithmus wendet Transferlernen an, indem er eine vorab trainierte Worteinbettung verwendet;
Führen Sie GAN_train_script.py aus. Dieses Skript ist selbsterklärend und fasst das neue gegnerische Training zusammen. Wenn Sie mit Ihren eigenen Daten trainieren möchten, fügen Sie diese nach demselben Muster in die Dateien „context_simple“ und „answers_simple“ ein. Wie im Skript zu sehen ist, verwende ich das Theano-Backend und die GPU. Für die Ausführung mit dem TensorFlow-Backend sind einige Modifikationen erforderlich.

Wenn Sie das gegnerische Training von Grund auf beginnen möchten, machen Sie die Gewichtsdatei my_model_weights.h5 (die neue gegnerische Methode vorab trainiert) gleich my_model_weights20.h5 (vorab trainiert durch Erzwingen durch den Lehrer) und führen Sie train_script.py aus.

Expandieren

Zusätzliche Informationen