Descarga Dialog - Descarga del código fuente Dialog

Dialog

Código Fuente de IA

1.0.0

Descargar

Diálogo

Dialog es un proyecto de chatbot japonés.
La arquitectura utilizada en este proyecto es el modelo EncoderDecoder que tiene BERT Encoder y Transformer Decoder.

Artículo escrito en japonés.

Noticias

Se agregaron cuadernos de colab.

Puede ejecutar scripts de capacitación y evaluación en Google Colab sin crear un entorno.
Por favor haga clic en el siguiente enlace.
Tenga en cuenta que en el cuaderno de capacitación, el comando de descarga se describe al final de la nota, pero aún no se ha probado. Por lo tanto, si ejecuta el cuaderno de entrenamiento y no puede descargar un archivo de peso entrenado, descárguelo manualmente.

Tren:
Evaluación:

Ejemplos de texto a voz

blog escrito en japonés

@ ycat3 creó un ejemplo de conversión de texto a voz utilizando este proyecto para la generación de oraciones y Parallel Wavenet para la síntesis de voz. El código fuente no se comparte, pero puedes reproducirlo si aprovechas Parallel Wavenet. Ese blog tiene algunas muestras de audio, así que intente escucharlo.

Me gustaría crear una aplicación que nos permita hablar con IA en voz mediante síntesis de voz y reconocimiento de voz si tengo mucho tiempo libre, pero ahora no puedo hacerlo debido a que me estoy preparando para los exámenes...

Contenido

Resultado
Modelo previamente entrenado
Uso
1. Instalar paquetes
2. Tren
3. Evaluar
Arquitectura

Resultado

2épocas

Resultado

Este modelo todavía contiene el problema de la respuesta aburrida.
Para resolver este problema estoy investigando ahora.

Luego encontré que el artículo abordaba este problema.

Otra función objetiva que promueve la diversidad para la generación de diálogo neuronal

Los autores pertenecen al Instituto Nara de Ciencia y Tecnología, también conocido como NAIST.
Proponen la nueva función objetivo de generación de diálogo neuronal.
Espero que este método pueda ayudarme a resolver ese problema.

Modelo previamente entrenado

Modelo previamente entrenado: ckpt.pth
Datos de entrenamiento: Training_data.txt o train_data.pkl

en googledrive.

Uso

Instalar paquetes.

Los paquetes necesarios son

pytorch
transformadores
tqdm
MeCab(Para usar transformadores.tokenization_bert_japanese.BertJapaneseTokenizer)
neologdn
emojis

Si se producen errores debido a los paquetes, instale los paquetes que faltan.

Ejemplo si usas conda.

 # create new environment
$ conda create -n dialog python=3.7

# activate new environment
$ activate dialog

# install pytorch
$ conda install pytorch torchvision cudatoolkit={YOUR_VERSION} -c pytorch

# install rest of depending package except for MeCab
$ pip install transformers tqdm neologdn emoji

# #### Already installed MeCab #####
# ## Ubuntu ###
$ pip install mecab-python3

# ## Windows ###
# check that "path/to/MeCab/bin" are added to system envrionment variable
$ pip install mecab-python-windows

# #### Not Installed MeCab #####
# install Mecab in accordance with your OS.
# method described in below is one of the way,
# so you can use your way if you'll be able to use transformers.BertJapaneseTokenizer.
# ## Ubuntu ###
# if you've not installed MeCab, please execute following comannds.
$ apt install aptitude
$ aptitude install mecab libmecab-dev mecab-ipadic-utf8 git make curl xz-utils file -y
$ pip install mecab-python3

# ## Windows ###
# Install MeCab from https://github.com/ikegami-yukino/mecab/releases/tag/v0.996
# and add "path/to/Mecab/bin" to system environment variable.
# then run the following command.
$ pip install mecab-python-windows

Tren

Preparar datos de conversación.

Descargar datos de entrenamiento desde google drive

tren_data.pkl

Cambiar ruta en config.py

 # in config.py, line 24
# default value is './data'
data_dir = 'path/to/dir_contains_training_data'

ejecutar

Si está listo para comenzar a entrenar, ejecute el script principal.

$ python main.py

Evaluar

Descargue el peso previamente entrenado desde Google Drive
Cambiar una ruta del modelo previamente entrenado en config.py

 # in config.py, line 24
# default value is './data'
data_dir = 'path/to/dir_contains_pretrained'

ejecutar eval.py

$ python run_eval.py

Uso de get_tweet.py

Si desea obtener más datos de la conversación, utilice get_tweet.py

Tenga en cuenta que debe cambiar consumer_key y access_token para poder utilizar este script.

Y luego, ejecute los siguientes comandos.

 # usage
$ python get_tweet.py " query " " Num of continuous utterances "

# Example
# This command works until occurs errors 
# and makes a file named "tweet_data_私は_5.txt" in "./data"
$ python get_tweet.py 私は 5