ChatPLUG
1.0.0
這是 ChatPLUG 專案的儲存庫,旨在建構和共享中文開放域對話系統。
愛用emoji的萌妹小婉 | 富有智慧的道高僧 | 會說古文的三國NPC關羽 |
---|---|---|
角色扮演聊天
與現有的開源模型相比,我們強調ChatPLUG的三個特點:
在推理過程中可以靈活地整合外部知識,並且這是可選的輸入。您可以利用
search engine
獲取最新資訊或使用本地知識庫來獲取領域知識。
透過設定
bot profiles
或使用role-paly instructions
可以輕鬆自訂對話和角色的風格。
它透過多輪對話展示了其在開放域對話方面的熟練程度,同時也在廣泛的 NLP 任務上展示了令人印象深刻的
multi-task abilities
。
我們提供三種使用或繼續開發 ChatPLUG 的方法,如下所示:
入門 | 推理 | 火車 | 部署 | |
---|---|---|---|---|
模型範圍 | 簡單的 | ✔️ 命令列 | 未準備好 | 未準備好 |
抱臉 | 中等的 | ✔️ 命令列 | 未準備好 | 未準備好 |
XDPX | 難的 | ✔️ 命令列 | ✔️ 支持 | ✔️ 服務 |
您可以從 ModelScope 下載並使用 ChatPLUG 模型。
型號名稱 | 網址 |
---|---|
聊天PLUG-240M | ChatPLUG-開放域對話模型-240M |
聊天PLUG-3.7B | ChatPLUG-開放域對話模型-3.7B |
即將推出。
XDPX 是一個易於使用的庫,允許研究人員和開發人員以簡化的方式訓練自訂模型並建立自己的聊天機器人。其一體化功能可提供一站式解決方案,簡化複雜的流程。快速啟動
使用 ChatPLUG-3.7B 時,可以設定
core_chat_half_precision : true
以節省記憶體。
# Requirement
# in the dir of XDPX
cd XDPX
pip install -e .
# Download checkpoints
# in the same dir as the download.sh
cd ..
sh download.sh
# Inference
# in the dir of XDPX
cd XDPX
CUDA_VISIBLE_DEVICES=0 x-script fidchat_new chat_pipeline/chatplug_3.7B_sftv2.6.0_instruction.hjson
# input `#exit` and exit the terminal
如果您的 GPU(例如 A100、A10)支援 bf16,請設定
deepspeed_bf16: true
和deepspeed_fp16: false
,否則設定deepspeed_bf16: false
和deepspeed_fp16: true
# 1. Download dataset from belle
# in ChatPLUG/data/belle dir
cd data/belle
git lfs install
git clone https://huggingface.co/datasets/BelleGroup/train_0.5M_CN
python process_belle_0.5M.py
# $ls data/belle
# train_0.jsonl dev.jsonl ...
# 2. Preprocess Data
# in XDPX dir
x-prepro chat_pipeline/chatplug_prepro_sft_instruction.hjson
# $ls data/dialogue/sft/chatplug/belle_instruction
# train_0.pt dev.pt
# 3. Training
# in XDPX dir
x-train chat_pipeline/chatplug_3.7B_train_sftv2.6.0_instruction.hjson
即將推出。
安裝說明請參閱安裝。
有關詳細的使用者指南,請參閱我們的文件:
使用者指南
高級指南
如果您發現我們的專案對您的工作有用,請引用:
@misc{tian2023chatplug,
title={ChatPLUG: Open-Domain Generative Dialogue System with Internet-Augmented Instruction Tuning for Digital Human},
author={Junfeng Tian and Hehong Chen and Guohai Xu and Ming Yan and Xing Gao and Jianhai Zhang and Chenliang Li and Jiayi Liu and Wenshen Xu and Haiyang Xu and Qi Qian and Wei Wang and Qinghao Ye and Jiejing Zhang and Ji Zhang and Fei Huang and Jingren Zhou},
year={2023},
eprint={2304.07849},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
@misc{plug2021,
title = {{PLUG: Pre-training for Language Understanding and Generation}},
author={ModelScope},
publisher = {ModelScope},
journal = {ModelScope repository},
year = {2021},
howpublished = {url{https://modelscope.cn/models/damo/nlp_plug_text-generation_27B/summary}},
}
此程式碼根據 Apache 許可證(版本 2.0)獲得許可。