Dialog下载 - Dialog源代码下载

Dialog

Ai源码

1.0.0

下载

对话

Dialog是日本聊天机器人项目。
该项目中使用的架构是 EncoderDecoder 模型，具有 BERT Encoder 和 Transformer Decoder。

文章用日语写的。

消息

添加了 Colab 笔记本。

您可以在google colab上运行训练和评估脚本，而无需构建环境。
请点击以下链接。
请注意，在训练笔记本中，注释末尾描述了下载命令，但尚未测试。因此，如果您运行训练笔记本并且无法下载训练后的权重文件，请手动下载。

火车：
评估：

文本转语音示例

用日语写的博客

@ycat3 通过使用该项目进行句子生成和用于语音合成的 Parallel Wavenet 创建了文本到语音示例。源代码不共享，但如果您利用 Parallel Wavenet，则可以重现它。该博客有一些音频样本，所以请尝试听一下。

如果我有很多空闲时间，我想创建一个应用程序，允许我们通过语音合成和语音识别与人工智能进行语音对话，但现在由于准备考试而无法做到这一点......

内容

结果
预训练模型
用法
1. 安装包
2. 火车
3. 评价
建筑学

结果

2个时期

该模型仍然存在响应迟钝的问题。
为了解决这个问题我现在正在研究。

然后我发现这篇论文解决了这个问题。

神经对话生成的另一种促进多样性的目标函数

作者来自奈良科学技术研究所（又名 NAIST）。
他们提出了神经对话生成的新目标函数。
我希望这个方法可以帮助我解决这个问题。

预训练模型

预训练模型：ckpt.pth
训练数据：training_data.txt 或 train_data.pkl

在谷歌驱动器中。

用法

安装软件包。

需要的包有

火炬
变形金刚
全面质量管理
MeCab（使用transformers.tokenization_bert_japanese.Bert JapaneseTokenizer）
新洛金
表情符号

如果因软件包原因出现错误，请安装缺少的软件包。

例如，如果您使用 conda。

 # create new environment
$ conda create -n dialog python=3.7

# activate new environment
$ activate dialog

# install pytorch
$ conda install pytorch torchvision cudatoolkit={YOUR_VERSION} -c pytorch

# install rest of depending package except for MeCab
$ pip install transformers tqdm neologdn emoji

# #### Already installed MeCab #####
# ## Ubuntu ###
$ pip install mecab-python3

# ## Windows ###
# check that "path/to/MeCab/bin" are added to system envrionment variable
$ pip install mecab-python-windows

# #### Not Installed MeCab #####
# install Mecab in accordance with your OS.
# method described in below is one of the way,
# so you can use your way if you'll be able to use transformers.BertJapaneseTokenizer.
# ## Ubuntu ###
# if you've not installed MeCab, please execute following comannds.
$ apt install aptitude
$ aptitude install mecab libmecab-dev mecab-ipadic-utf8 git make curl xz-utils file -y
$ pip install mecab-python3

# ## Windows ###
# Install MeCab from https://github.com/ikegami-yukino/mecab/releases/tag/v0.996
# and add "path/to/Mecab/bin" to system environment variable.
# then run the following command.
$ pip install mecab-python-windows

火车

准备对话数据。

从谷歌驱动器下载训练数据

训练数据.pkl

更改config.py中的路径

 # in config.py, line 24
# default value is './data'
data_dir = 'path/to/dir_contains_training_data'

执行

如果您准备好开始训练，请运行主脚本。

$ python main.py

评价

从谷歌驱动器下载预训练的权重
更改config.py中预训练模型的路径

 # in config.py, line 24
# default value is './data'
data_dir = 'path/to/dir_contains_pretrained'

运行 eval.py

$ python run_eval.py

get_tweet.py 的用法

如果您想获取更多对话数据，请使用 get_tweet.py

请注意，您必须更改consumer_key和access_token才能使用此脚本。

然后，执行以下命令。

 # usage
$ python get_tweet.py " query " " Num of continuous utterances "

# Example
# This command works until occurs errors 
# and makes a file named "tweet_data_私は_5.txt" in "./data"
$ python get_tweet.py 私は 5