Dialog Download – Download Dialog Quellcodes

Dialog

AI-Quellcode

1.0.0

Herunterladen

Dialog

Dialog ist ein japanisches Chatbot-Projekt.
Die in diesem Projekt verwendete Architektur ist das EncoderDecoder-Modell mit BERT-Encoder und Transformer-Decoder.

Artikel auf Japanisch verfasst.

Nachricht

Colab-Notizbücher hinzugefügt.

Sie können Trainings- und Bewertungsskripte auf Google Colab ausführen, ohne eine Umgebung erstellen zu müssen.
Bitte klicken Sie auf folgenden Link.
Beachten Sie, dass der Download-Befehl im Schulungsnotizbuch am Ende des Hinweises beschrieben wird, aber noch nicht getestet wurde. Wenn Sie also ein Trainingsnotizbuch verwenden und keine Trainingsgewichtsdatei herunterladen können, laden Sie es bitte manuell herunter.

Zug:
Bewertung:

Beispiele für Text-to-Speech

Blog auf Japanisch geschrieben

@ycat3 hat ein Text-to-Speech-Beispiel erstellt, indem dieses Projekt zur Satzgenerierung und Parallel Wavenet zur Sprachsynthese verwendet wurden. Der Quellcode wird nicht geteilt, aber Sie können ihn reproduzieren, wenn Sie Parallel Wavenet nutzen. In diesem Blog gibt es einige Hörbeispiele, also probieren Sie es bitte mal aus.

Ich würde gerne eine App erstellen, die es uns ermöglicht, mithilfe von Sprachsynthese und Spracherkennung mit KI per Sprache zu sprechen, wenn ich viel Freizeit habe, aber jetzt kann ich das aufgrund der Prüfungsvorbereitung nicht tun ...

Inhalt

Ergebnis
Vorab trainiertes Modell
Verwendung
1. Pakete installieren
2. Zug
3. Auswerten
Architektur

Ergebnis

2Epochen

Ergebnis

Dieses Modell weist immer noch das Problem der dumpfen Reaktion auf.
Um dieses Problem zu lösen, recherchiere ich gerade.

Dann fand ich heraus, dass das Papier dieses Problem angeht.

Eine weitere diversitätsfördernde Zielfunktion für die Erzeugung neuronaler Dialoge

Die Autoren gehören dem Nara Institute of Science and Technology, auch bekannt als NAIST, an.
Sie schlagen die neue Zielfunktion der Erzeugung neuronaler Dialoge vor.
Ich hoffe, dass diese Methode mir helfen kann, dieses Problem zu lösen.

Vorab trainiertes Modell

Vorab trainiertes Modell: ckpt.pth
Trainingsdaten: training_data.txt oder train_data.pkl

in Google Drive.

Verwendung

Pakete installieren.

Benötigte Pakete sind

Pytorch
Transformatoren
tqdm
MeCab (zur Verwendung von Transformers.tokenization_bert_japanese.BertJapaneseTokenizer)
neologdn
Emoji

Sollten aufgrund der Pakete Fehler auftreten, installieren Sie bitte fehlende Pakete.

Beispiel, wenn Sie Conda verwenden.

 # create new environment
$ conda create -n dialog python=3.7

# activate new environment
$ activate dialog

# install pytorch
$ conda install pytorch torchvision cudatoolkit={YOUR_VERSION} -c pytorch

# install rest of depending package except for MeCab
$ pip install transformers tqdm neologdn emoji

# #### Already installed MeCab #####
# ## Ubuntu ###
$ pip install mecab-python3

# ## Windows ###
# check that "path/to/MeCab/bin" are added to system envrionment variable
$ pip install mecab-python-windows

# #### Not Installed MeCab #####
# install Mecab in accordance with your OS.
# method described in below is one of the way,
# so you can use your way if you'll be able to use transformers.BertJapaneseTokenizer.
# ## Ubuntu ###
# if you've not installed MeCab, please execute following comannds.
$ apt install aptitude
$ aptitude install mecab libmecab-dev mecab-ipadic-utf8 git make curl xz-utils file -y
$ pip install mecab-python3

# ## Windows ###
# Install MeCab from https://github.com/ikegami-yukino/mecab/releases/tag/v0.996
# and add "path/to/Mecab/bin" to system environment variable.
# then run the following command.
$ pip install mecab-python-windows

Zug

Gesprächsdaten vorbereiten.

Laden Sie Trainingsdaten von Google Drive herunter

train_data.pkl

Ändern Sie den Pfad in config.py

 # in config.py, line 24
# default value is './data'
data_dir = 'path/to/dir_contains_training_data'

Ausführen

Wenn Sie bereit sind, mit dem Training zu beginnen, führen Sie das Hauptskript aus.

$ python main.py

Auswerten

Laden Sie das vortrainierte Gewicht von Google Drive herunter
Ändern Sie einen Pfad des vorab trainierten Modells in config.py

 # in config.py, line 24
# default value is './data'
data_dir = 'path/to/dir_contains_pretrained'

Führen Sie eval.py aus

$ python run_eval.py

Verwendung von get_tweet.py

Wenn Sie weitere Konversationsdaten erhalten möchten, verwenden Sie bitte get_tweet.py

Beachten Sie, dass Sie Consumer_key und Access_token ändern müssen, um dieses Skript verwenden zu können.

Führen Sie dann die folgenden Befehle aus.

 # usage
$ python get_tweet.py " query " " Num of continuous utterances "

# Example
# This command works until occurs errors 
# and makes a file named "tweet_data_私は_5.txt" in "./data"
$ python get_tweet.py 私は 5