Это репозиторий проекта ChatPLUG, целью которого является создание и распространение китайской диалоговой системы с открытым доменом.
爱用emoji的萌妹子小婉 | 富有智慧的得道高僧 | 会说古文的的三国NPC关羽 |
---|---|---|
Ролевая игра-чат
По сравнению с существующими моделями с открытым исходным кодом мы выделяем три особенности ChatPLUG:
В процессе вывода можно гибко интегрировать внешние знания, и это необязательный вход. Вы можете использовать
search engine
для получения актуальной информации или использовать местную базу знаний для получения знаний в предметной области.
Стиль разговоров и персонажей легко настроить, настроив
bot profiles
или используяrole-paly instructions
.
Он демонстрирует свое мастерство в открытом диалоге посредством многоходовой беседы, а также демонстрирует впечатляющие
multi-task abilities
при решении широкого спектра задач НЛП.
Мы предлагаем три метода использования или продолжения разработки ChatPLUG:
Начиная | Вывод | Тренироваться | Развертывать | |
---|---|---|---|---|
МодельОбъем | Легкий | ✔️ Кли | Не готов | Не готов |
ОбниматьЛицо | Середина | ✔️ Кли | Не готов | Не готов |
XDPX | Жесткий | ✔️ Кли | ✔️ Поддержка | ✔️ Сервировка |
Вы можете загрузить и использовать модели ChatPLUG из ModelScope.
Название модели | URL-адрес |
---|---|
ЧатПЛУГ-240М | ChatPLUG-开放域对话模型-240M |
ЧатPLUG-3.7B | ChatPLUG-开放域对话模型-3.7B |
Вскоре.
XDPX — это простая в использовании библиотека, которая позволяет исследователям и разработчикам упрощенно обучать собственные модели и создавать собственных чат-ботов. Его функциональность «все в одном» позволяет найти универсальное решение, которое упрощает сложные процессы. быстрый старт
При использовании ChatPLUG-3.7B вы можете установить
core_chat_half_precision : true
для экономии памяти.
# Requirement
# in the dir of XDPX
cd XDPX
pip install -e .
# Download checkpoints
# in the same dir as the download.sh
cd ..
sh download.sh
# Inference
# in the dir of XDPX
cd XDPX
CUDA_VISIBLE_DEVICES=0 x-script fidchat_new chat_pipeline/chatplug_3.7B_sftv2.6.0_instruction.hjson
# input `#exit` and exit the terminal
Если ваш графический процессор (например, A100, A10) поддерживает bf16, установите
deepspeed_bf16: true
иdeepspeed_fp16: false
, в противном случае установитеdeepspeed_bf16: false
иdeepspeed_fp16: true
# 1. Download dataset from belle
# in ChatPLUG/data/belle dir
cd data/belle
git lfs install
git clone https://huggingface.co/datasets/BelleGroup/train_0.5M_CN
python process_belle_0.5M.py
# $ls data/belle
# train_0.jsonl dev.jsonl ...
# 2. Preprocess Data
# in XDPX dir
x-prepro chat_pipeline/chatplug_prepro_sft_instruction.hjson
# $ls data/dialogue/sft/chatplug/belle_instruction
# train_0.pt dev.pt
# 3. Training
# in XDPX dir
x-train chat_pipeline/chatplug_3.7B_train_sftv2.6.0_instruction.hjson
Вскоре.
Инструкции по установке см. в разделе «Установка».
Подробные руководства пользователя можно найти в нашей документации:
Руководства пользователя
Расширенные руководства
Если наш проект окажется полезным для вашей работы, пожалуйста, укажите:
@misc{tian2023chatplug,
title={ChatPLUG: Open-Domain Generative Dialogue System with Internet-Augmented Instruction Tuning for Digital Human},
author={Junfeng Tian and Hehong Chen and Guohai Xu and Ming Yan and Xing Gao and Jianhai Zhang and Chenliang Li and Jiayi Liu and Wenshen Xu and Haiyang Xu and Qi Qian and Wei Wang and Qinghao Ye and Jiejing Zhang and Ji Zhang and Fei Huang and Jingren Zhou},
year={2023},
eprint={2304.07849},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
@misc{plug2021,
title = {{PLUG: Pre-training for Language Understanding and Generation}},
author={ModelScope},
publisher = {ModelScope},
journal = {ModelScope repository},
year = {2021},
howpublished = {url{https://modelscope.cn/models/damo/nlp_plug_text-generation_27B/summary}},
}
Этот код распространяется по лицензии Apache (версия 2.0).