Download Adversarial Learning for Generative Conversational Agents - Download do código-fonte Adversarial Learning for Generative Conversational Agents

Adversarial Learning for Generative Conversational Agents

Código-Fonte de IA

versarial Learning for Generative Conversational Agents

Baixar

Aprendizagem Adversarial para Agentes Conversacionais Generativos

Este repositório contém um novo método de treinamento adversário para nosso Agente Conversacional Generativo (GCA).

Mais detalhes sobre esse novo método de treinamento podem ser encontrados no artigo Oswaldo Ludwig, "End-to-end Adversarial Learning for Generative Conversational Agents", arXiv:1711.10122 cs.CL, Nov 2017. No caso de publicação utilizando ideias ou trechos de código deste repositório, por favor cite este artigo.

Nosso método assume o GCA como um gerador que visa enganar um discriminador que rotula os diálogos como gerados por humanos ou por máquinas. Na nossa abordagem, o discriminador realiza a classificação em nível de token, ou seja, indica se o token atual foi gerado por humanos ou máquinas. Para fazer isso, o discriminador também recebe como entrada as declarações de contexto (o histórico do diálogo) e a resposta incompleta até o token atual. Esta nova abordagem possibilita o treinamento ponta a ponta por retropropagação. Um processo de autoconversação permite produzir um conjunto de dados gerados com maior diversidade para o treinamento adversário. Esta abordagem melhora o desempenho em questões não relacionadas aos dados de treinamento.

O modelo treinado aqui disponível utilizou um conjunto de dados coletados de diálogos de cursos de inglês online, disponíveis aqui.

Nosso modelo GCA pode ser explicado pelo seguinte fluxograma:

etiqueta alternativa

enquanto o pseudocódigo a seguir explica nosso algoritmo GCA:

etiqueta alternativa

Nosso novo treinamento adversário ponta a ponta pode ser explicado pelo seguinte modelo Keras (implementado no arquivo train_bot_GAN.py), que é composto pelo gerador e pelo discriminador. Os blocos amarelos pertencem ao GCA (o gerador), enquanto os blocos verdes pertencem ao discriminador. Os blocos brancos são compartilhados entre gerador e discriminador:

etiqueta alternativa

enquanto o pseudocódigo a seguir explica o novo algoritmo (veja o artigo para a definição das variáveis):

etiqueta alternativa

Para conversar com os modelos pré-treinados:

Baixe o arquivo python "conversation_GAN.py", o arquivo de vocabulário "vocabulary_movie" e os pesos líquidos "my_model_weights20.h5" (treinados pela força do professor) e "my_model_weights.h5" (treinados pelo novo método adversário), que podem ser encontrado aqui;
Execute conversa_GAN.py.

Para avaliar linhas de diálogo usando o discriminador pré-treinado:

Baixe o arquivo python "run_discriminator_GAN.py", o arquivo de vocabulário "vocabulary_movie" e os pesos líquidos do discriminador "my_model_weights_discriminator.h5", que podem ser encontrados aqui;
Execute run_discriminator_GAN.py.

Para treinar de ponta a ponta usando o novo método adversário:

Baixe todos os arquivos aqui;
Baixe a pasta Glove 'glove.6B' e inclua esta pasta no diretório do chatbot (você pode encontrar esta pasta aqui). Este algoritmo aplica a aprendizagem por transferência usando uma incorporação de palavras pré-treinadas;
Execute GAN_train_script.py. Este script é autoexplicativo e resume o novo treinamento adversário. Se você quiser treinar com seus próprios dados, inclua-os nos arquivos "context_simple" e "answers_simple" seguindo o mesmo padrão. Como pode ser visto no script, estou usando backend e GPU Theano, algumas modificações são necessárias para executá-lo com backend TensorFlow.

Se você deseja iniciar o treinamento adversário do zero, torne o arquivo de peso my_model_weights.h5 (pré-treinado no novo método adversário) igual a my_model_weights20.h5 (pré-treinado pela força do professor) e execute train_script.py.

Expandir

Informações adicionais

Versão versarial Learning for Generative Conversational Agents
Tipo Código-Fonte de IA
Data da Última Atualização 2024-12-11
tamanho 335.75KB
Vindo de Github

Aplicativos Relacionados

Parameter Efficient Transfer Learning Benchmark

2024-11-06
awesome generative ai guide

2024-11-05
atomic agents

2024-11-02
Agentes do Caos

2022-08-20
Aprendizagem PHP5 (Aprendendo PHP)

2009-05-24
OReilly Aprendendo PHP e MySQL 2ª Edição

2009-05-24

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
node telegram bot api

Código-Fonte de IA

v0.50.0
typebot.io

Código-Fonte de IA

v3.1.2
python wechaty getting started

Código-Fonte de IA

1.0.0
waymo open dataset

Outro código-fonte

December 2023 Update
termwind

Outras categorias

v2.3.0
wp functions

Outras categorias

1.0.0

Informações Relacionadas Todos