ดาวน์โหลด CareGPT - ดาวน์โหลดซอร์สโค้ด CareGPT

จีน |. อังกฤษ

วิดีโอสอน การติดตั้งและการปรับใช้ ประสบการณ์ออนไลน์

⚡คุณสมบัติ:

เพิ่มการใช้งานการปรับแต่ง ChatGPT อย่างละเอียด และแนะนำเพื่อนพร้อมเครดิตเพื่อทำการทดลองปรับแต่ง ChatGPT
รองรับรูปแบบการปรับใช้ ChatGPT-Next-Web แบบละเอียด
รองรับโมเดลการปรับแต่งการปรับใช้ Gradio;
รองรับการฝึกโมเดล LLaMA และ LLaMA-2 ซีรีส์เต็ม;
รองรับ LoRA และ QLoRA รวมถึงการฝึกอบรมการเรียนรู้การเสริมกำลัง PPO และ DPO ที่ตามมา
รองรับการถามตอบรวมกับโมเดลและฐานความรู้
ข้อมูลคำแนะนำทางการแพทย์แบบโอเพ่นซอร์สสำหรับแผนกโรงพยาบาลมากกว่า 60 แห่ง
พัฒนาเครื่องมือเพื่อรองรับการกลั่นข้อมูลทางการแพทย์แบบจำลอง GPT-4/ChatGPT ซึ่งสามารถสร้างข้อมูลที่หลากหลายสำหรับการสร้างฐานความรู้และการปรับแต่งอย่างละเอียด
โดยรวบรวม LLM ทางการแพทย์แบบโอเพ่นซอร์สมากมาย ข้อมูลทางการแพทย์สำหรับการฝึกอบรม LLM ข้อมูลการปรับใช้ LLM การประเมิน LLM และการรวบรวมทรัพยากร LLM ที่เกี่ยวข้อง
เราเข้าร่วมในการประเมินรายการ CMB ของ LLM ทางการแพทย์ - IvyGPT ในการทดสอบ เรานำหน้า ChatGPT และ LLM ทางการแพทย์แบบโอเพ่นซอร์สจำนวนหนึ่ง
เรามี LLM ทางการแพทย์แบบโอเพ่นซอร์สหลายตัวที่ได้รับการฝึกอบรมบน LLM พื้นฐานที่แตกต่างกันโดยอิงตามชุดข้อมูลของเราเอง คุณสามารถดาวน์โหลดโดยตรงเพื่อสัมผัสประสบการณ์

?ชุดข้อมูล

ข้อมูลก่อนการฝึกอบรม

LLM-Pretrain-FineTune/data_pretrain
GPT ทางการแพทย์/ฝึกล่วงหน้า
ซิจ
TCM-Ancient-Books (ตำรายาจีนโบราณเกือบ 700 เล่ม)
epfl-llm/แนวทางปฏิบัติ

ข้อมูลการฝึกอบรมภายใต้การดูแล

icliniq-10k(th)
การดูแลสุขภาพMagic-100k(th)
ShenNong_TCM_ชุดข้อมูล
✅ChatMed_Consult_ชุดข้อมูล
ข้อมูลบทสนทนาทางการแพทย์จีน
cMedQA2
✅ฮั่วถัว-26M
cMedQA2
webMedQA
PubMedQA
ซีเอ็มซีคิวเอ
✅QiZhenGPT
✅LLM-Pretrain-FineTune/data_sft
ระบบการสนทนาทางการแพทย์
ไอเอ็มซีเอส-V2
ชิป-MDCFNPC
เมดดีจี
✅HuatuoGPT-sft-data-v1
GPT ทางการแพทย์/finetune
✅ชิบิง624/เมดิคอล
medAlpaca/ข้อมูล
✅จงจิง/sft
การแพทย์_โต้ตอบ
huatuo_encyclopedia_qa
Med-ChatGLM/ข้อมูล
ซีเอ็มบี
GenMedGPT-5k(en)
อัลปาก้า-CoT(ทั่วไป)
✅DISC-Med-SFT
✅HuatuoGPT2_sft_instruct
FreedomIntelligence/Medbase_data
openmedlab/Awesome-Medical-ชุดข้อมูล

ข้อมูลการฝึกอบรมรางวัล

GPT ทางการแพทย์/รางวัล
จงจิง/rw
comparison_gpt4_data
HH-RLHF
อัลตร้าฟีดแบ็ก

️การฝึกอบรมแบบครบวงจร

1. ติดตั้งการพึ่งพา

 conda create - n llm python = 3.11
conda activate llm
python - m pip install - r requirements . txt

ดาวน์โหลดโมเดล LLaMA: https://blog.csdn.net/u014297502/article/details/129829677

 # 转为HF格式
python - m transformers . models . llama . convert_llama_weights_to_hf 
    - - input_dir path_to_llama_weights - - model_size 7 B - - output_dir path_to_llama_model

ดาวน์โหลดโมเดล LLaMA-2: https://huggingface.co/meta-llama

2.การกำหนดค่าข้อมูล

การกำหนดค่าชุดข้อมูล, รูปแบบข้อมูล PT, SFT, RW

ชุดข้อมูล_info

หากคุณใช้ชุดข้อมูลที่กำหนดเอง อย่าลืมระบุคำจำกัดความของชุดข้อมูลในไฟล์ dataset_info.json ในรูปแบบต่อไปนี้

 "数据集名称" : {
  "hf_hub_url" : " HuggingFace上的项目地址（若指定，则忽略下列三个参数） " ,
  "script_url" : "包含数据加载脚本的本地文件夹名称（若指定，则忽略下列两个参数） " ,
  "file_name" : "该目录下数据集文件的名称（若上述参数未指定，则此项必需） " ,
  "file_sha1" : "数据集文件的SHA-1哈希值（可选） " ,
  "columns" : {
    "prompt" : "数据集代表提示词的表头名称（默认：instruction） " ,
    "query" : "数据集代表请求的表头名称（默认：input） " ,
    "response" : "数据集代表回答的表头名称（默认：output） " ,
    "history" : "数据集代表历史对话的表头名称（默认：None） "
  }
}

คอลัมน์ prompt และ response ควรเป็นสตริงที่ไม่ว่างเปล่า เนื้อหาของคอลัมน์ query จะถูกต่อเข้ากับคอลัมน์ prompt เป็นอินพุตโมเดล คอลัมน์ history ควรเป็นรายการ โดยแต่ละองค์ประกอบคือสตริงทูเพิลที่แสดงถึงคำขอของผู้ใช้และการตอบกลับของโมเดลตามลำดับ

ข้อมูลตัวอย่าง PT

รูปแบบ .txt หนึ่งข้อมูลที่ไม่มีผู้ดูแลต่อบรรทัด

Machine learning (ML) is a field devoted to understanding and building methods that let machines "learn" – that is, methods that leverage data to improve computer performance on some set of tasks.
Machine learning algorithms build a model based on sample data, known as training data, in order to make predictions or decisions without being explicitly programmed to do so. Machine learning algorithms are used in a wide variety of applications, such as in medicine, email filtering, speech recognition, agriculture, and computer vision, where it is difficult or unfeasible to develop conventional algorithms to perform the needed tasks.

ข้อมูลตัวอย่าง SFT 1

[
  {
    "instruction" : "听起来很不错。人工智能可能在哪些方面面临挑战呢？ " ,
    "input" : " " ,
    "output" : "人工智能面临的挑战包括数据隐私、安全和道德方面的问题，以及影响就业机会的自动化等问题。 " ,
    "history" : [
      [ "你好，你能帮我解答一个问题吗？ " , "当然，请问有什么问题？ " ],
      [ "我想了解人工智能的未来发展方向，你有什么想法吗？ " , "人工智能在未来的发展方向可能包括更强大的机器学习算法，更先进的自然语言处理技术，以及更加智能的机器人。 " ]
    ]
  }
]

ข้อมูลตัวอย่าง SFT 2

[
  {
    "instruction" : "听起来很不错。人工智能可能在哪些方面面临挑战呢？ " ,
    "input" : " " ,
    "output" : "人工智能面临的挑战包括数据隐私、安全和道德方面的问题，以及影响就业机会的自动化等问题。 " ,
    "history" : []
  }
]

ข้อมูลตัวอย่าง RW

[
  {
    "instruction" : "生成三个与“道歉”意思相同的动词" ,
    "input" : " " ,
    "output" : [
      "承认，表示遗憾，弥补。 " ,
      "道歉"
    ]
  }
]

3. การกำหนดค่าการฝึกอบรม

พารามิเตอร์การฝึกอบรมและคำแนะนำ

กำหนดค่าแบบกระจาย

ตรวจสอบว่าการ์ดแสดงผลของคุณเชื่อมต่อกับ NVLINK หรือไม่ เฉพาะการเชื่อมต่อ NVLINK เท่านั้นที่คุณสามารถใช้ accelerate สำหรับการฝึกเร่งความเร็วแบบขนานได้อย่างมีประสิทธิภาพ

 nvidia-smi topo -m

 accelerate config # configure the environment
accelerate launch src / train_bash . py # arguments (same as above)

การฝึกอบรมภายใต้การดูแล

 # LLaMA-2
accelerate launch src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_train 
    - - dataset mm 
    - - finetuning_type lora 
    - - quantization_bit 4 
    - - overwrite_cache 
    - - output_dir output 
    - - per_device_train_batch_size 8 
    - - gradient_accumulation_steps 4 
    - - lr_scheduler_type cosine 
    - - logging_steps 10 
    - - save_steps 1000 
    - - learning_rate 5e-5 
    - - num_train_epochs 2.0 
    - - plot_loss 
    - - fp16 
    - - template llama2 
    - - lora_target q_proj , v_proj

# LLaMA
accelerate launch src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - do_train 
    - - dataset mm , hm 
    - - finetuning_type lora 
    - - overwrite_cache 
    - - output_dir output - 1 
    - - per_device_train_batch_size 4 
    - - gradient_accumulation_steps 4 
    - - lr_scheduler_type cosine 
    - - logging_steps 10 
    - - save_steps 2000 
    - - learning_rate 5e-5 
    - - num_train_epochs 2.0 
    - - plot_loss 
    - - fp16 
    - - template default 
    - - lora_target q_proj , v_proj

การเรียนรู้การเสริมกำลัง

 # LLaMA-2, DPO
accelerate launch src / train_bash . py 
    - - stage dpo 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_train 
    - - dataset rlhf 
    - - template llama2 
    - - finetuning_type lora 
    - - quantization_bit 4 
    - - lora_target q_proj , v_proj 
    - - resume_lora_training False 
    - - checkpoint_dir . / output - 2 
    - - output_dir output - dpo 
    - - per_device_train_batch_size 2 
    - - gradient_accumulation_steps 4 
    - - lr_scheduler_type cosine 
    - - logging_steps 10 
    - - save_steps 1000 
    - - learning_rate 1e-5 
    - - num_train_epochs 1.0 
    - - plot_loss 
    - - fp16

4. การกำหนดค่าการอนุมาน

พารามิเตอร์และคำแนะนำในการอนุมาน

การเข้าถึงเว็บ

 # LLaMA-2
python src / web_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / web_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

# DPO
python src / web_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output - dpo 
    - - finetuning_type lora 
    - - template llama2

การเข้าถึง API

 # LLaMA-2
python src / api_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / api_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

# DPO
python src / api_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output - dpo 
    - - finetuning_type lora 
    - - template llama2

ทดสอบ API:

 curl - X 'POST' 
    'http://127.0.0.1:8888/v1/chat/completions' 
    - H 'accept: application/json' 
    - H 'Content-Type: application/json' 
    - d ' {
    "model" : "string",
    "messages": [
      {
        "role" : "user",
        "content": "你好"
      }
    ],
    " temperature ": 0 ,
    "top_p" : 0 ,
    "max_new_tokens" : 0 ,
    "stream" : false
  }'

การเข้าถึง CLI

 # LLaMA-2
python src / cli_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / cli_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

# DPO
python src / cli_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output - dpo 
    - - finetuning_type lora 
    - - template llama2

การทำนายแบบกลุ่ม

 # LLaMA-2
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_predict 
    - - dataset mm 
    - - template llama2 
    - - finetuning_type lora 
    - - checkpoint_dir output 
    - - output_dir predict_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

# LLaMA
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - do_predict 
    - - dataset mm 
    - - template default 
    - - finetuning_type lora 
    - - checkpoint_dir output - 1 
    - - output_dir predict_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

การประเมินการทดลอง (BLEU และ ROUGE_CHINESE)

 # LLaMA-2
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_eval 
    - - dataset mm 
    - - template llama2 
    - - finetuning_type lora 
    - - checkpoint_dir output 
    - - output_dir eval_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

# LLaMA
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - do_eval 
    - - dataset mm 
    - - template default 
    - - finetuning_type lora 
    - - checkpoint_dir output - 1 
    - - output_dir eval_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

สำหรับการประเมินแบบ 4/8 บิต ขอแนะนำให้ใช้ --per_device_eval_batch_size=1 และ --max_target_length 128

5. การใช้งาน Gradio

คำแนะนำการใช้งาน Gradio

การส่งออกโมเดล

 # LLaMA-2
python src / export_model . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - template llama2 
    - - finetuning_type lora 
    - - checkpoint_dir output - 1 
    - - output_dir output_export

# LLaMA
python src / export_model . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - template default 
    - - finetuning_type lora 
    - - checkpoint_dir output 
    - - output_dir output_export

เริ่มวิ่ง

 % cd Gradio
python app . py

6.ChatGPT-Next-เว็บปรับใช้

คำแนะนำในการใช้งานถัดไป

เริ่มบริการ API

 # LLaMA-2
python src / api_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / api_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

ดาวน์โหลดถัดไปและเรียกใช้

ดาวน์โหลดต่อไป:

แก้ไขการกำหนดค่า: ติดตั้งและเปิดถัดไป จากนั้นเปิด设置แก้ไข接口地址เป็น: http://127.0.0.1:8000/ (นั่นคือ ที่อยู่อินเทอร์เฟซ API ของคุณ) จากนั้นคุณจึงจะสามารถใช้งานได้

?ประสบการณ์จริง

ใน CareGPT การแบ่งส่วนคำภาษาจีนจะไม่ถูกเพิ่มและฝึกใหม่ให้กับโมเดลการแบ่งส่วนคำ แต่ผลลัพธ์ยังคงมีแนวโน้มที่ดี
กระบวนการทั้งหมดของการฝึกอบรม LLM ประกอบด้วย: การฝึกอบรมล่วงหน้า การปรับแต่งแบบละเอียดภายใต้การดูแล แบบจำลองการให้รางวัล และการเรียนรู้แบบเสริมกำลัง ในกรณีส่วนใหญ่ การปรับแต่งแบบละเอียดภายใต้การดูแลสามารถตอบสนองความต้องการของคุณได้
เมื่อพลังการประมวลผลเพียงพอ ขอแนะนำ ให้ใช้ข้อมูลทางการแพทย์และข้อมูลคลังข้อมูลทั่วไปสำหรับการฝึกอบรม เพื่อให้แบบจำลองไม่เพียงแต่มีการฝึกอบรมและการเรียนรู้ทางการแพทย์เท่านั้น แต่ยังรักษาความสามารถทั่วไปไว้ได้ (เช่น คำแนะนำต่อไปนี้)
อย่าคาดหวังว่า LLM ทางการแพทย์เพียงแห่งเดียวจะสามารถตอบสนองทุกความต้องการได้ แนวทางที่สมเหตุสมผลอาจเป็น ฐานความรู้ที่อัปเดตแบบเรียลไทม์ + LLM ทางการแพทย์ที่ได้รับการปรับแต่งอย่างดี (เช่น ChatLaw)
ซีรีส์โมเดล BLOOMZ ได้รับการฝึกโดยใช้คลังข้อมูล PILE ซึ่งมีข้อความทางการแพทย์ต่างๆ รวมถึง PubMed Central และ PubMed Abstracts ข้อความอันทรงคุณค่าเหล่านี้ได้เสริมสร้างระบบความรู้ทางการแพทย์ของโมเดล BLOOMZ อย่างมาก ดังนั้นโครงการโอเพ่นซอร์สจำนวนมากจึงให้ความสำคัญกับ BLOOMZ เป็นโมเดลพื้นฐานสำหรับการปรับแต่งทางการแพทย์
(2023.08.26) ChatGPT ได้รับการฝึกอบรมตาม Code GPT เราจะใช้ CodeLLaMA เพื่อปรับแต่งงานดาวน์สตรีมเพื่อให้ได้ผลลัพธ์ที่ดีกว่าการปรับแต่ง LLaMA-1/2 หรือไม่
การผสมผสานผลงานล่าสุดของเราเข้ากับผลงานที่ได้รับการตีพิมพ์เมื่อเร็วๆ นี้พิสูจน์ให้เห็นแล้วว่า ในยุค LLM质量> 数量คือความจริง เช่น: Less is More! ส่งมอบให้กับ Qingyuan&& Caspian | ใช้ข้อมูล 200 ชิ้นเพื่อปรับแต่งโมเดลอย่างละเอียด มินิจีพีที-4 ! ข้อมูล SFT ขนาดใหญ่พิเศษจะทำให้ LLM งานดาวน์สตรีมอ่อนแอลง หรือสูญเสีย ICL, CoT และความสามารถอื่นๆ
สำหรับโมเดลแนวตั้ง บางทีเราควรให้ความสำคัญกับกระบวนการ PT มากขึ้น แทนที่จะรวบรวมข้อมูล SFT นับสิบล้านสำหรับการฝึกอบรม คำแนะนำของเราคือ大规模预训练+小规模监督微调=超强的LLM模型
LLM ทางการแพทย์ที่ได้รับการฝึกอบรมล่วงหน้าที่ดียังไม่ได้เปิดในชุมชนโอเพ่นซอร์ส และฉันหวังว่าจะมีคนช่วยเสริมงานดังกล่าวได้
การฝึกอบรมล่วงหน้าสามารถเติมความรู้ ในขณะที่การปรับแต่งแบบละเอียดภายใต้การดูแลจะเปิดใช้งานความสามารถของโดเมนเท่านั้น (ไม่สามารถมุ่งเน้นไปที่ความรู้) ความรู้ก่อนการฝึกอบรมควรสะท้อนความรู้ที่ได้รับการปรับปรุงอย่างละเอียดหรือไม่ ความรู้เกี่ยวกับคลังข้อมูลที่ได้รับการฝึกอบรมล่วงหน้าจำนวนหลายสิบ GB จะถูกครอบงำโดยความรู้เกี่ยวกับโมเดลที่ได้รับการฝึกอบรมล่วงหน้าดั้งเดิมซึ่งมีโทเค็นล้านล้านล้านหรือไม่
การฝึกอบรมล่วงหน้าขั้นที่สองของข้อมูลจำนวนมากจำเป็นต้องมีการจับคู่ข้อมูลอื่นๆ หลายประเภท: (1) หลังจากการฝึกอบรมโมเดลภาษาเสร็จสิ้น จะมีการกำหนดส่วนที่รับผิดชอบของแต่ละพื้นที่ของพารามิเตอร์ หากมีความรู้จำนวนมาก ที่ไม่สามารถใช้ได้ในระหว่างการฝึกอบรมล่วงหน้า พารามิเตอร์จะเพิ่มขึ้น การเปลี่ยนแปลงขนาดทำให้สูญเสียความสามารถของโมเดลภาษาทั้งหมด (2) สำหรับการฝึกอบรมล่วงหน้าขั้นที่สองของข้อมูลขนาดใหญ่ 5-10 เท่าของข้อมูลในต้นฉบับ จำเป็นต้องเพิ่ม ผสม และฝึกอบรมก่อนการฝึกอบรมร่วมกัน
ขั้นตอนการปรับแต่งคำสั่งอย่างละเอียดไม่สามารถดำเนินการฝึกอบรมได้หลายรอบเกินไป: (1) การฝึกอบรม EPOCH หลายรายการด้วยข้อมูลจำนวนเล็กน้อยอาจทำให้เกิดการเปลี่ยนแปลงในส่วนสำคัญของภาษา ซึ่งนำไปสู่ความล้มเหลวของแบบจำลองทั้งหมด (2) การเรียนการสอนที่ดี -การปรับแต่งสำหรับการปรับปรุงงานเฉพาะ เพื่อให้แน่ใจว่าพื้นที่สำคัญของความสามารถทางภาษาของแบบจำลองไม่ได้รับการปรับอย่างมีนัยสำคัญ จำเป็นต้องเพิ่มข้อมูลการปรับแต่งคำแนะนำทั่วไปหรือข้อมูลการฝึกอบรมล่วงหน้า
ข้อมูลการฝึกอบรมจะต้องควบคุมเสียงรบกวนอย่างเคร่งครัด: (1) หากมีข้อมูลเสียงรบกวนต่อเนื่องจำนวนเล็กน้อยในข้อมูลก่อนการฝึกอบรม เช่น การซ้ำคำอย่างต่อเนื่อง ลำดับที่ไม่ใช่คำ เป็นต้น อาจทำให้เกิดการปรับเปลี่ยนมิติเฉพาะได้ ทำให้ PPL โดยรวมของโมเดลมีความผันผวนอย่างมาก (2) หากมีส่วนคำสั่งจำนวนมากในคำสั่งการปรับแต่งที่ได้รับการดูแลซึ่งไม่ตรงกับโมเดลภาษาขนาดใหญ่ดั้งเดิม ก็อาจทำให้โมเดลปรับขนาดเฉพาะได้ ซึ่งจะช่วยลดประสิทธิภาพโดยรวมของโมเดลลงอย่างมาก
เมื่อปรับแต่งโมเดลขนาดใหญ่ด้วยข้อมูลผสมที่มีความสามารถหลากหลาย จะปรากฏ: ความขัดแย้งด้านทรัพยากรสูงและการได้รับทรัพยากรต่ำ ดังนั้นการผสมข้อมูลที่แตกต่างกันสำหรับการปรับแต่งอย่างละเอียดต้องใช้ทักษะทางวิศวกรรมบางอย่าง
โดยทั่วไปแล้ว ประสิทธิภาพการทำงานที่แตกต่างกันระหว่าง lora และการปรับแต่งแบบเต็มนั้นมีความแตกต่างกันเล็กน้อย (เช่น LoRA ส่งผลให้ประสิทธิภาพลดลง 4-6% เมื่อเทียบกับการปรับแต่งแบบละเอียดเต็มรูปแบบ)
โปรดให้ความสำคัญกับวิธีการปรับแต่งแบบเต็มพารามิเตอร์สำหรับรุ่นซีรีส์ 7B LoRA, QLoRA และวิธีการอื่นๆ สามารถใช้ได้กับรุ่นพารามิเตอร์ 13B และสูงกว่า
แม้ว่าโมเดลพารามิเตอร์ที่มีขนาดใหญ่มากจะถูกวัดปริมาณ แต่ความสามารถของโมเดลก็ยังคงสามารถรักษาไว้ได้เป็นอย่างดี
แม้ว่าการฝึก LLM (หรือทุกรุ่นที่ฝึกด้วย GPU) จะมีการสุ่มอย่างหลีกเลี่ยงไม่ได้ แต่ผลลัพธ์ของการฝึกหลายรอบยังคงมีความสอดคล้องกันมาก
หากคุณถูกจำกัดด้วยหน่วยความจำ GPU QLoRA มอบการประนีประนอมที่คุ้มต้นทุน ช่วยประหยัดหน่วยความจำได้ 33% โดยใช้เวลาทำงานเพิ่มขึ้น 39%
เมื่อทำการปรับแต่ง LLM อย่างละเอียด การเลือกเครื่องมือเพิ่มประสิทธิภาพไม่ใช่ปัจจัยหลักที่ส่งผลต่อผลลัพธ์ ไม่ว่าจะเป็น AdamW, SGD พร้อมตัวกำหนดเวลา หรือ AdamW พร้อมตัวกำหนดเวลา ผลกระทบต่อผลลัพธ์มีน้อยมาก
แม้ว่า Adam มักจะถูกมองว่าเป็นเครื่องมือเพิ่มประสิทธิภาพที่เน้นหน่วยความจำ เนื่องจากแนะนำพารามิเตอร์ใหม่สองตัวสำหรับพารามิเตอร์แต่ละรุ่น ซึ่งไม่ส่งผลกระทบอย่างมีนัยสำคัญต่อข้อกำหนดหน่วยความจำสูงสุดของ LLM เนื่องจากหน่วยความจำส่วนใหญ่จะถูกจัดสรรสำหรับการคูณเมทริกซ์ขนาดใหญ่ แทนที่จะเก็บพารามิเตอร์เพิ่มเติมไว้
สำหรับชุดข้อมูลคงที่ การวนซ้ำหลายครั้ง เช่น การฝึกหลายรอบอาจไม่ได้ผลดีนัก สิ่งนี้มักนำไปสู่การออกกำลังกายมากเกินไปและทำให้ผลการฝึกแย่ลง
หากคุณต้องการรวม LoRA ตรวจสอบให้แน่ใจว่าได้นำไปใช้กับทุกเลเยอร์ ไม่ใช่แค่เมทริกซ์คีย์และค่า เพื่อที่จะเพิ่มประสิทธิภาพสูงสุดของโมเดล
การปรับอันดับ LoRA และเลือกค่า α ที่เหมาะสมเป็นสิ่งสำคัญ เพื่อให้เป็นเคล็ดลับเล็กๆ น้อยๆ ให้ลองตั้งค่า α ให้เป็นสองเท่าของค่าอันดับ
GPU ตัวเดียวที่มี RAM ขนาด 14GB สามารถปรับแต่งโมเดลขนาดใหญ่ที่มีพารามิเตอร์ถึง 7 พันล้านพารามิเตอร์ได้อย่างมีประสิทธิภาพภายในเวลาไม่กี่ชั่วโมง สำหรับชุดข้อมูลคงที่ เป็นไปไม่ได้ที่จะเสริมความแข็งแกร่งของ LLM ให้เป็น "ผู้รอบรู้" และทำงานได้ดีในงานพื้นฐานทั้งหมด การแก้ปัญหานี้ต้องใช้แหล่งข้อมูลที่หลากหลายหรือการใช้เทคโนโลยีอื่นที่ไม่ใช่ LoRA
ตามคำแนะนำของเวิร์กช็อป NeurIPS ณ วันที่ 18 ธันวาคม 2023 รุ่นที่ได้รับการปรับแต่งที่แนะนำ英文10B以下选择Mistral-7B中文, 10B以下选择Yi-6B 10B และ 10B以上选择Qwen-14B和Yi-34B ;

สำคัญ

ยินดีให้ทุกคนเพิ่มประสบการณ์ใหม่ๆ ให้กับ ISSUE!

ระเบียบวิธี 11~13 มาจากแบบจำลองภาษาขนาดใหญ่กว่า 13 พันล้านแบบ การเปลี่ยนแปลงน้ำหนักเพียงครั้งเดียวจะทำให้ความสามารถทางภาษาหายไปโดยสิ้นเชิง! งานวิจัยล่าสุดจากห้องปฏิบัติการประมวลผลภาษาธรรมชาติของมหาวิทยาลัยฟู่ตัน

14วิธีการจากความสามารถในโมเดลภาษาขนาดใหญ่ได้รับผลกระทบจากองค์ประกอบข้อมูลที่มีการปรับแต่งอย่างละเอียดภายใต้การดูแลอย่างไร

วิธีการ 17~25 มาจาก LLM Optimization: Layer-wise Optimal Rank Adaptation (LORA) การตีความเวอร์ชันภาษาจีน

?โมเดลโอเพ่นซอร์ส

เวที	รู้เบื้องต้นเกี่ยวกับน้ำหนัก	ดาวน์โหลดที่อยู่	คุณสมบัติ	โมเดลพื้นฐาน	วิธีการปรับแบบละเอียด	ชุดข้อมูล
?การกำกับดูแลและการปรับแต่ง	ข้อมูลบทสนทนาแบบหลายเลี้ยวได้รับการฝึกอบรมตาม LLaMA2-7b-Chat	CareLlama2-7b-แชท-sft-หลาย、?CareLlama2-7b-หลาย	ทักษะการสนทนาหลายรอบที่ยอดเยี่ยม	LLaMA2-7b-แชท	คิวลอรา	มม
กำกับดูแลการปรับจูน	ข้อมูลการสนทนาระหว่างแพทย์และผู้ป่วยที่สมบูรณ์และมีประสิทธิภาพได้รับการฝึกอบรมบน LLaMA2-7b-Chat	CareLlama2-7b-แชท-sft-med	ความสามารถในการวินิจฉัยโรคของผู้ป่วยที่ดีเยี่ยม	LLaMA2-7b-แชท	คิวลอรา	อืม
กำกับดูแล

ขยาย