تنزيل AMchat - تنزيل كود مصدر AMchat

AMchat

كود الذكاء الاصطناعي

1.0.0

تنزيل

AMchat الرياضيات المتقدمة نموذج كبير

?المعانقة |

أخبار

[2024.08.09] أصدرنا نموذج التكميم Q8_0 AMchat-q8_0.gguf.

[2024.06.23] الضبط الدقيق لنموذج InternLM2-Math-Plus-20B.

[2024.06.22] مجموعة بيانات صغيرة الحجم ومفتوحة المصدر للضبط الدقيق لنموذج InternLM2-Math-Plus-1.8B.

[2024.06.21] تم تحديث الملف التمهيدي (README)، الضبط الدقيق لنموذج InternLM2-Math-Plus-7B.

[2024.03.24] المراكز الـ 12 الأولى في تحدي سلسلة النماذج الكبيرة Puyuan لعام 2024 (مسابقة الربيع)، جائزة الابتكار والإبداع.

[2024.03.14] تم تحميل النموذج على HuggingFace.

[2024.03.08] ملف README محسّن، وإضافة كتالوج ومسار تقني. تمت إضافة README_en-US.md.

[2024.02.06] يتم دعم نشر Docker.

[2024.02.01] تم نشر الإصدار الأول من AMchat عبر الإنترنت https://openxlab.org.cn/apps/detail/youngdon/AMchat

كيفية الاستخدام

بداية سريعة

تحميل النموذج

من موديل سكوب

تحميل النموذج المرجعي.

pip install modelscope

 from modelscope . hub . snapshot_download import snapshot_download
model_dir = snapshot_download ( 'yondong/AMchat' , cache_dir = './' )

منOpenXLab

انظر نموذج التحميل

pip install openxlab

 from openxlab . model import download
download ( model_repo = 'youngdon/AMchat' , 
        model_name = 'AMchat' , output = './' )

النشر المحلي

git clone https://github.com/AXYZdong/AMchat.git
python start.py

نشر عامل ميناء

docker run -t -i --rm --gpus all -p 8501:8501 guidonsdocker/amchat:latest bash start.sh

إعادة تدريب

إعداد البيئة

استنساخ هذا المشروع

git clone https://github.com/AXYZdong/AMchat.git
cd AMchat

إنشاء بيئة افتراضية

conda env create -f environment.yml
conda activate AMchat
pip install xtuner

ضبط XTuner

تحضير ملف التكوين

 # 列出所有内置配置
xtuner list-cfg

mkdir -p /root/math/data
mkdir /root/math/config && cd /root/math/config

xtuner copy-cfg internlm2_chat_7b_qlora_oasst1_e3 .

تحميل النموذج

mkdir -p /root/math/model

download.py

 import torch
from modelscope import snapshot_download , AutoModel , AutoTokenizer
import os
model_dir = snapshot_download ( 'Shanghai_AI_Laboratory/internlm2-math-7b' , cache_dir = '/root/math/model' )

تعديل ملف التكوين

تم توفير ملف تكوين مضبوط ضمن مجلد config في المستودع. يمكنك الرجوع إلى internlm_chat_7b_qlora_oasst1_e3_copy.py . يمكن استخدامه مباشرة، يرجى الانتباه إلى تعديل مسارات pretrained_model_name_or_path و data_path .

 cd /root/math/config
vim internlm_chat_7b_qlora_oasst1_e3_copy.py

 # 修改模型为本地路径
- pretrained_model_name_or_path = 'internlm/internlm-chat-7b'
+ pretrained_model_name_or_path = './internlm2-math-7b'

# 修改训练数据集为本地路径
- data_path = 'timdettmers/openassistant-guanaco'
+ data_path = './data'

ابدأ بالضبط الدقيق

xtuner train /root/math/config/internlm2_chat_7b_qlora_oasst1_e3_copy.py

تم تحويل نموذج PTH إلى نموذج HuggingFace

mkdir hf
export MKL_SERVICE_FORCE_INTEL=1
export MKL_THREADING_LAYER=GNU
xtuner convert pth_to_hf ./internlm2_chat_7b_qlora_oasst1_e3_copy.py 
                         ./work_dirs/internlm2_chat_7b_qlora_oasst1_e3_copy/epoch_3.pth 
                         ./hf

تم دمج نموذج HuggingFace في نموذج لغة كبير

 # 原始模型参数存放的位置
export NAME_OR_PATH_TO_LLM=/root/math/model/Shanghai_AI_Laboratory/internlm2-math-7b

# Hugging Face格式参数存放的位置
export NAME_OR_PATH_TO_ADAPTER=/root/math/config/hf

# 最终Merge后的参数存放的位置
mkdir /root/math/config/work_dirs/hf_merge
export SAVE_PATH=/root/math/config/work_dirs/hf_merge

# 执行参数Merge
xtuner convert merge 
    $NAME_OR_PATH_TO_LLM 
    $NAME_OR_PATH_TO_ADAPTER 
    $SAVE_PATH 
    --max-shard-size 2GB

تجريبي

streamlit run web_demo.py --server.address=0.0.0.0 --server.port 7860

نشر تطبيق OpenXLab

ما عليك سوى Fork هذا المستودع، ثم إنشاء مشروع جديد على OpenXLab، وربط مستودع Fork بالمشروع الجديد، ويمكنك نشر AMchat على OpenXLab.

تجريبي

حل AMchat وInternLM2-Math-7B لنفس المشكلة المتعلقة بالتكامل. أجاب AMchat بشكل صحيح، أجاب InterLM2-Math-7B بشكل غير صحيح.

تجريبي

LMDeploy الكمي

قم أولاً بتثبيت LMDeploy

pip install -U lmdeploy

ثم قم بتحويل النموذج إلى تنسيق turbomind

--dst-path: يمكنك تحديد موقع تخزين النموذج المحول.

lmdeploy convert internlm2-chat-7b  要转化的模型地址 --dst-path 转换后的模型地址

LMDنشر محادثة الدردشة

lmdeploy chat turbomind 转换后的turbomind模型地址

مراجعة البوصلة المفتوحة

تثبيتOpenCompass

git clone https://github.com/open-compass/opencompass
cd opencompass
pip install -e .

قم بتنزيل مجموعة البيانات التي تم فك ضغطها

cp /share/temp/datasets/OpenCompassData-core-20231110.zip /root/opencompass/
unzip OpenCompassData-core-20231110.zip

يبدأ التقييم!

python run.py 
    --datasets math_gen 
    --hf-path 模型地址 
    --tokenizer-path tokenizer地址 
    --tokenizer-kwargs padding_side= ' left ' truncation= ' left '     trust_remote_code=True 
    --model-kwargs device_map= ' auto ' trust_remote_code=True 
    --max-seq-len 2048 
    --max-out-len 16 
    --batch-size 2  
    --num-gpus 1 
    --debug

LMDeploy وOpenCompass التقييم الكمي والكمي

W4 التقييم الكمي

W4 الكمي

lmdeploy lite auto_awq 要量化的模型地址 --work-dir 量化后的模型地址

تحويل إلى TurbMind

lmdeploy convert internlm2-chat-7b 量化后的模型地址  --model-format awq --group-size 128 --dst-path 转换后的模型地址

كتابة config التقييم

 from mmengine . config import read_base
from opencompass . models . turbomind import TurboMindModel

with read_base ():
 # choose a list of datasets   
 from . datasets . ceval . ceval_gen import ceval_datasets 
 # and output the results in a choosen format
#  from .summarizers.medium import summarizer

datasets = [ * ceval_datasets ]

internlm2_chat_7b = dict (
     type = TurboMindModel ,
     abbr = 'internlm2-chat-7b-turbomind' ,
     path = '转换后的模型地址' ,
     engine_config = dict ( session_len = 512 ,
         max_batch_size = 2 ,
         rope_scaling_factor = 1.0 ),
     gen_config = dict ( top_k = 1 ,
         top_p = 0.8 ,
         temperature = 1.0 ,
         max_new_tokens = 100 ),
     max_out_len = 100 ,
     max_seq_len = 512 ,
     batch_size = 2 ,
     concurrency = 1 ,
     #  meta_template=internlm_meta_template,
     run_cfg = dict ( num_gpus = 1 , num_procs = 1 ),
)
models = [ internlm2_chat_7b ]

يبدأ التقييم!

python run.py configs/eval_turbomind.py -w 指定结果保存路径

التقييم الكمي لذاكرة التخزين المؤقت KV

تحويل إلى TurbMind

lmdeploy convert internlm2-chat-7b  模型路径 --dst-path 转换后模型路径

حساب والحصول على معلمات التكميم

 # 计算
lmdeploy lite calibrate 模型路径 --calib-dataset ' ptb ' --calib-samples 128 --calib-seqlen 2048 --work-dir 参数保存路径
# 获取量化参数
lmdeploy lite kv_qparams 参数保存路径 转换后模型路径/triton_models/weights/ --num-tp 1

قم بتغيير quant_policy إلى 4 وقم بتغيير المسار في config أعلاه
يبدأ التقييم!

python run.py configs/eval_turbomind.py -w 结果保存路径

يمكن الحصول على ملفات النتائج ومجموعات بيانات التقييم في ملف النتائج في نفس الدليل.

شكر وتقدير؟

أعضاء المشروع

Zhang Youdong - قائد المشروع (مساعد تدريس المعسكر العملي Puyu الباحث في Datawhale هو المسؤول عن التدريب النموذجي، ونشر تطبيق OpenXlab، وجمع البيانات، وتنظيم محتوى RAG، والتخطيط الدقيق لـ InternLM2-Math-Plus)
Song Zhixue - قائد المشروع (باحث عضو في Datawhale ومساعد تدريس في معسكر Puyu العملي مسؤول عن تخطيط المشروع وإطار عمل RAG)
شياو هونغرو - قائد المشروع (باحث في جامعة تونغجي عضو في Datawhale ومساعد تدريس في معسكر Puyu العملي مسؤول عن جمع البيانات وفرز مجموعة البيانات وتعزيزها وتقدير النماذج وتقييمها واستدلال RAG والتحقق منها)
Cheng Hong (مساعد تدريس في معسكر Scholar Puyu العملي ومساعد تدريس في Datawhale Jingying InternLM2-Math-Plus-7B Model Fine-tuning & Deployment)
مو باوكي (معهد يوشاي لأبحاث الهندسة InternLM2-Math-Plus-1.8B الضبط الدقيق للنموذج)
تشين فويوان (متدرب في جامعة قانسو للعلوم السياسية والقانونLM2-Math-Plus-20B للضبط الدقيق)
غونغ هيانغ (دكتوراه في الإحصاء، جامعة العلوم والتكنولوجيا في الصين، القياس الكمي لنموذج LMDeploy)
Jie Rongyang (عضو Datawhale معهد هاربين للتكنولوجيا (Weihai) لجمع البيانات RAG تجميع المحتوى)
Peng Chen (جمع بيانات أعضاء Datawhale)
وانغ شينمينغ (جمع البيانات)
ليو زيوين (مجموعة البيانات من جامعة شاندونغ النسائية، عضو في Datawhale)
وانغ رويو (جمع بيانات جامعة الشمال الشرقي)
Chen Yihan (عضو Datawhale في جامعة بكين للبريد والاتصالات وجمع البيانات)
إرشادات (نشر عامل ميناء جامعة الشمال الشرقي)
eltociear (عضو مجلس إدارة في شركة I-Tecnology Co., Ltd.، أضف الملف README الياباني)

شكر خاص

شكرًا لمختبر شنغهاي للذكاء الاصطناعي على تنظيم النشاط التعليمي لمعسكر Scholar Puyu العملي ~

بفضل OpenXLab لدعمه قوة الحوسبة لنشر المشروع ~

شكرًا لمساعد Puyu لدعم المشروع ~

شكرًا لمختبر شنغهاي للذكاء الاصطناعي على إطلاق المعسكر العملي للنموذج الكبير Scholar·Puyu، والذي يوفر إرشادات فنية قيمة ودعمًا قويًا لقدرة الحوسبة لمشروعنا!

برنامج InternLM التعليمي ، InternStudio ، xtuner ، InternLM-Math

الاقتباس

 @misc { 2024AMchat ,
    title = { AMchat: A large language model integrating advanced math concepts, exercises, and solutions } ,
    author = { AMchat Contributors } ,
    howpublished = { url{https://github.com/AXYZdong/AMchat} } ,
    year = { 2024 }
}