pytorch chatbot
1.0.0
이것은 pratical-pytorch seq2seq-translation-batched를 수정한 Formosa Speech Grand Challenge용 pytorch seq2seq 튜토리얼입니다.
pytorch 공식 웹사이트 Tutorial in Chinese에서 이 저장소를 소개하는 튜토리얼입니다.
새 버전이 이미 "dev" 분기에 구현되어 있습니다.
git clone https://github.com/ywk991112/pytorch-chatbot
코퍼스 파일에서 입출력 시퀀스 쌍은 인접한 줄에 있어야 합니다. 예를 들어,
I'll see you next time.
Sure. Bye.
How are you?
Better than ever.
말뭉치 파일은 다음과 같은 경로에 있어야 합니다.
pytorch-chatbot/data/
그렇지 않으면 말뭉치 파일이 git에 의해 추적됩니다.
양방향 RNN 레이어와 숨겨진 크기 512가 있는 movie_subtitles 코퍼스의 사전 학습된 모델을 이 링크에서 다운로드할 수 있습니다. 사전 학습된 모델 파일은 다음과 같이 디렉터리에 배치되어야 합니다.
mkdir -p save/model/movie_subtitles/1-1_512
mv 50000_backup_bidir_model.tar save/model/movie_subtitles/1-1_512
훈련을 시작하려면 이 명령을 실행하고 필요에 따라 인수 값을 변경하세요.
python main.py -tr -la 1 -hi 512 -lr 0.0001 -it 50000 -b 64 -p 500 -s 1000
저장된 모델로 훈련을 계속하세요.
python main.py -tr -l -lr 0.0001 -it 50000 -b 64 -p 500 -s 1000
더 많은 옵션을 보려면,
python main.py -h
훈련하는 동안 모델은 pytorch-chatbot/save/model
에 저장되며 이는 config.py
에서 변경할 수 있습니다.
코퍼스의 입력 시퀀스를 사용하여 저장된 모델을 평가합니다.
python main.py -te -c
입력 시퀀스를 사용하여 모델을 수동으로 테스트합니다.
python main.py -te -c -i
크기 k로 빔 검색.
python main.py -te -c -be k [-i]