นี่คือ repo สำหรับโครงการ ChatPLUG ซึ่งมีเป้าหมายเพื่อสร้างและแบ่งปันระบบการสนทนาแบบโอเพ่นโดเมนของจีน
爱用emoji的萌妹子小婉 | 富有智慧的得道高僧 | 会说古文的的三关羽 |
---|---|---|
สวมบทบาท-แชท
เมื่อเปรียบเทียบกับรุ่นโอเพ่นซอร์สที่มีอยู่ เราเน้นสามคุณสมบัติของ ChatPLUG ดังนี้:
บูรณาการความรู้ภายนอกระหว่างการอนุมานได้อย่างยืดหยุ่น และนี่คืออินพุตเสริม คุณสามารถใช้
search engine
เพื่อรับข้อมูลที่ทันสมัย หรือใช้ฐานความรู้ท้องถิ่นเพื่อรับความรู้ในโดเมน
ปรับแต่งสไตล์การสนทนาและตัวละครได้อย่างง่ายดายโดยการตั้งค่า
bot profiles
หรือใช้role-paly instructions
โดยแสดงให้เห็นถึงความเชี่ยวชาญในการสนทนาแบบเปิดโดเมนผ่านการสนทนาแบบสลับสับเปลี่ยนกัน ขณะเดียวกันก็แสดง
multi-task abilities
ที่น่าประทับใจในงาน NLP ที่หลากหลาย
เรามีสามวิธีในการใช้หรือพัฒนา ChatPLUG ต่อไปดังนี้:
เริ่มต้นใช้งาน | การอนุมาน | รถไฟ | ปรับใช้ | |
---|---|---|---|---|
โมเดลสโคป | ง่าย | ✔️คลี | ไม่พร้อม | ไม่พร้อม |
กอดใบหน้า | ปานกลาง | ✔️คลี | ไม่พร้อม | ไม่พร้อม |
XDPX | แข็ง | ✔️คลี | ✔️สนับสนุน | ✔️เสิร์ฟ |
คุณสามารถดาวน์โหลดและใช้โมเดล ChatPLUG ได้จาก ModelScope
ชื่อรุ่น | URL |
---|---|
แชทPLUG-240M | ChatPLUG-เริ่ม放域对话模型-240M |
ChatPLUG-3.7B | ChatPLUG-เริ่ม放域对话模型-3.7B |
เร็วๆ นี้.
XDPX เป็นไลบรารีที่ใช้งานง่าย ซึ่งช่วยให้นักวิจัยและนักพัฒนาสามารถฝึกฝนโมเดลที่กำหนดเองและสร้างแชทบอทของตัวเองได้อย่างคล่องตัว ฟังก์ชันการทำงานแบบครบวงจรช่วยให้เกิดโซลูชันแบบครบวงจรที่ทำให้กระบวนการที่ซับซ้อนง่ายขึ้น เริ่มต้นอย่างรวดเร็ว
เมื่อใช้ ChatPLUG-3.7B คุณสามารถตั้งค่า
core_chat_half_precision : true
เพื่อประหยัดหน่วยความจำ
# Requirement
# in the dir of XDPX
cd XDPX
pip install -e .
# Download checkpoints
# in the same dir as the download.sh
cd ..
sh download.sh
# Inference
# in the dir of XDPX
cd XDPX
CUDA_VISIBLE_DEVICES=0 x-script fidchat_new chat_pipeline/chatplug_3.7B_sftv2.6.0_instruction.hjson
# input `#exit` and exit the terminal
หาก GPU ของคุณ (เช่น A100、A10) รองรับ bf16 ให้ตั้งค่า
deepspeed_bf16: true
และdeepspeed_fp16: false
หรือมิฉะนั้นให้ตั้งค่าdeepspeed_bf16: false
และdeepspeed_fp16: true
# 1. Download dataset from belle
# in ChatPLUG/data/belle dir
cd data/belle
git lfs install
git clone https://huggingface.co/datasets/BelleGroup/train_0.5M_CN
python process_belle_0.5M.py
# $ls data/belle
# train_0.jsonl dev.jsonl ...
# 2. Preprocess Data
# in XDPX dir
x-prepro chat_pipeline/chatplug_prepro_sft_instruction.hjson
# $ls data/dialogue/sft/chatplug/belle_instruction
# train_0.pt dev.pt
# 3. Training
# in XDPX dir
x-train chat_pipeline/chatplug_3.7B_train_sftv2.6.0_instruction.hjson
เร็วๆ นี้.
โปรดดูการติดตั้งสำหรับคำแนะนำในการติดตั้ง
สำหรับคู่มือผู้ใช้โดยละเอียด โปรดดูเอกสารประกอบของเรา:
คู่มือผู้ใช้
คำแนะนำขั้นสูง
หากคุณพบว่าโครงการของเรามีประโยชน์ในการทำงานของคุณ โปรดอ้างอิง:
@misc{tian2023chatplug,
title={ChatPLUG: Open-Domain Generative Dialogue System with Internet-Augmented Instruction Tuning for Digital Human},
author={Junfeng Tian and Hehong Chen and Guohai Xu and Ming Yan and Xing Gao and Jianhai Zhang and Chenliang Li and Jiayi Liu and Wenshen Xu and Haiyang Xu and Qi Qian and Wei Wang and Qinghao Ye and Jiejing Zhang and Ji Zhang and Fei Huang and Jingren Zhou},
year={2023},
eprint={2304.07849},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
@misc{plug2021,
title = {{PLUG: Pre-training for Language Understanding and Generation}},
author={ModelScope},
publisher = {ModelScope},
journal = {ModelScope repository},
year = {2021},
howpublished = {url{https://modelscope.cn/models/damo/nlp_plug_text-generation_27B/summary}},
}
รหัสนี้ได้รับอนุญาตภายใต้ Apache License (เวอร์ชัน 2.0)