pytorch chatbot
1.0.0
這是Formosa Speech Grand Challenge的pytorch seq2seq教程,由pratical-pytorch seq2seq-translation-batched修改而來。
介紹這個repo的教學來自pytorch官網,中文教學。
新版本已經在分支“dev”中實作。
git clone https://github.com/ywk991112/pytorch-chatbot
在語料庫檔案中,輸入輸出序列對應位於相鄰行。例如,
I'll see you next time.
Sure. Bye.
How are you?
Better than ever.
語料庫文件應放置在下列路徑下:
pytorch-chatbot/data/
否則,語料庫檔案將被 git 追蹤。
可以在此連結中下載 movie_subtitles 語料庫上具有雙向 rnn 層和隱藏大小 512 的預訓練模型。預訓練的模型檔案應放置在以下目錄中。
mkdir -p save/model/movie_subtitles/1-1_512
mv 50000_backup_bidir_model.tar save/model/movie_subtitles/1-1_512
執行此命令開始訓練,根據自己的需求更改參數值。
python main.py -tr -la 1 -hi 512 -lr 0.0001 -it 50000 -b 64 -p 500 -s 1000
使用已儲存的模型繼續訓練。
python main.py -tr -l -lr 0.0001 -it 50000 -b 64 -p 500 -s 1000
如需更多選擇,
python main.py -h
訓練時模型將保存在pytorch-chatbot/save/model
中,這可以在config.py
中更改。
使用語料庫中的輸入序列評估已儲存的模型。
python main.py -te -c
手動使用輸入序列測試模型。
python main.py -te -c -i
大小為 k 的集束搜尋。
python main.py -te -c -be k [-i]