CareGPT 다운로드 - CareGPT 소스 코드 다운로드

CareGPT

AI 소스 코드

1.0.0

다운로드

중국어 |

비디오 튜토리얼 설치 및 배포 온라인 경험

⚡특징:

ChatGPT 미세 조정 구현을 추가하고 크레딧이 있는 친구를 추천하여 ChatGPT에서 미세 조정 실험을 수행할 수 있도록 했습니다.
ChatGPT-Next-Web 배포 미세 조정 모델을 지원합니다.
Gradio 배포 미세 조정 모델을 지원합니다.
LLaMA 및 LLaMA-2 전체 시리즈 모델 교육을 지원합니다.
후속 PPO 및 DPO 강화 학습 교육을 포함하여 LoRA 및 QLoRA를 지원합니다.
모델 및 지식 기반과 결합된 Q&A를 지원합니다.
60개 이상의 병원 부서에 대한 오픈 소스 의료 지침 자료 정보
지식 기반 구축 및 미세 조정을 위한 다양한 데이터를 일괄 생성할 수 있는 의료 데이터의 GPT-4/ChatGPT 모델 증류를 지원하는 도구를 개발했습니다.
풍부한 오픈 소스 의료 LLM, LLM 교육을 위한 의료 데이터, LLM 배포 데이터, LLM 평가 및 관련 LLM 리소스 수집을 집계합니다.
우리는 의료 LLM - IvyGPT의 CMB 목록 평가에 참여했습니다. 테스트에서 우리는 ChatGPT 및 다수의 오픈 소스 의료 LLM보다 앞서 있었습니다.
우리는 자체 데이터 세트를 기반으로 다양한 기본 LLM에서 훈련된 여러 의료 LLM을 오픈 소스로 보유하고 있으며 이를 직접 다운로드하여 경험할 수 있습니다.

?데이터세트

사전 훈련 데이터

LLM-사전 훈련-FineTune/data_pretrain
MedicalGPT/프리트레인
zyj
TCM-Ancient-Books(약 700개의 고대 중국 의학 문헌)
epfl-llm/지침

지도 학습 데이터

icliniq-10k(en)
HealthCareMagic-100k(en)
ShenNong_TCM_Dataset
✅ChatMed_Consult_Dataset
한의학대화자료
cMedQA2
✅화타-26M
cMedQA2
webMedQA
PubMedQA
CMCQA
✅QiZhenGPT
✅LLM-사전 훈련-FineTune/data_sft
의료-대화-시스템
IMCS-V2
칩-MDCFNPC
MedDG
✅HuatuoGPT-sft-data-v1
MedicalGPT/finetune
✅shibing624/medical
medAlpaca/데이터
✅중징/sft
의료_대화
huatuo_encyclopedia_qa
Med-ChatGLM/데이터
CMB
GenMedGPT-5k(en)
알파카-CoT(일반)
✅DISC-Med-SFT
✅HuatuoGPT2_sft_instruct
FreedomIntelligence/Medbase_data
openmedlab/Awesome-Medical-Dataset

훈련 데이터 보상

MedicalGPT/보상
중징/rw
비교_gpt4_데이터
HH-RLHF
울트라피드백

?️전체 프로세스 교육

1. 종속성 설치

 conda create - n llm python = 3.11
conda activate llm
python - m pip install - r requirements . txt

LLaMA 모델 다운로드: https://blog.csdn.net/u014297502/article/details/129829677

 # 转为HF格式
python - m transformers . models . llama . convert_llama_weights_to_hf 
    - - input_dir path_to_llama_weights - - model_size 7 B - - output_dir path_to_llama_model

LLaMA-2 모델 다운로드: https://huggingface.co/meta-llama

2.데이터 구성

데이터 세트 구성, PT, SFT, RW 데이터 형식

데이터 세트_정보

사용자 지정 데이터세트를 사용하는 경우 다음 형식으로 dataset_info.json 파일에 데이터세트 정의를 제공해야 합니다.

 "数据集名称" : {
  "hf_hub_url" : " HuggingFace上的项目地址（若指定，则忽略下列三个参数） " ,
  "script_url" : "包含数据加载脚本的本地文件夹名称（若指定，则忽略下列两个参数） " ,
  "file_name" : "该目录下数据集文件的名称（若上述参数未指定，则此项必需） " ,
  "file_sha1" : "数据集文件的SHA-1哈希值（可选） " ,
  "columns" : {
    "prompt" : "数据集代表提示词的表头名称（默认：instruction） " ,
    "query" : "数据集代表请求的表头名称（默认：input） " ,
    "response" : "数据集代表回答的表头名称（默认：output） " ,
    "history" : "数据集代表历史对话的表头名称（默认：None） "
  }
}

prompt 및 response 열은 비어 있지 않은 문자열이어야 합니다. query 열의 내용은 모델 입력으로 prompt 열과 연결됩니다. history 열은 목록이어야 하며, 여기서 각 요소는 각각 사용자 요청과 모델 응답을 나타내는 문자열 튜플입니다.

PT 예시 데이터

.txt 형식, 한 줄에 하나의 비지도 데이터.

Machine learning (ML) is a field devoted to understanding and building methods that let machines "learn" – that is, methods that leverage data to improve computer performance on some set of tasks.
Machine learning algorithms build a model based on sample data, known as training data, in order to make predictions or decisions without being explicitly programmed to do so. Machine learning algorithms are used in a wide variety of applications, such as in medicine, email filtering, speech recognition, agriculture, and computer vision, where it is difficult or unfeasible to develop conventional algorithms to perform the needed tasks.

SFT 예시 데이터 1

[
  {
    "instruction" : "听起来很不错。人工智能可能在哪些方面面临挑战呢？ " ,
    "input" : " " ,
    "output" : "人工智能面临的挑战包括数据隐私、安全和道德方面的问题，以及影响就业机会的自动化等问题。 " ,
    "history" : [
      [ "你好，你能帮我解答一个问题吗？ " , "当然，请问有什么问题？ " ],
      [ "我想了解人工智能的未来发展方向，你有什么想法吗？ " , "人工智能在未来的发展方向可能包括更强大的机器学习算法，更先进的自然语言处理技术，以及更加智能的机器人。 " ]
    ]
  }
]

SFT 예시 데이터 2

[
  {
    "instruction" : "听起来很不错。人工智能可能在哪些方面面临挑战呢？ " ,
    "input" : " " ,
    "output" : "人工智能面临的挑战包括数据隐私、安全和道德方面的问题，以及影响就业机会的自动化等问题。 " ,
    "history" : []
  }
]

RW 예시 데이터

[
  {
    "instruction" : "生成三个与“道歉”意思相同的动词" ,
    "input" : " " ,
    "output" : [
      "承认，表示遗憾，弥补。 " ,
      "道歉"
    ]
  }
]

3. 훈련 구성

훈련 매개변수 및 지침

분산 구성

그래픽 카드가 NVLINK에 연결되어 있는지 확인하세요. NVLINK 연결을 통해서만 병렬 가속 훈련에 accelerate 효과적으로 사용할 수 있습니다.

 nvidia-smi topo -m

 accelerate config # configure the environment
accelerate launch src / train_bash . py # arguments (same as above)

지도 교육

 # LLaMA-2
accelerate launch src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_train 
    - - dataset mm 
    - - finetuning_type lora 
    - - quantization_bit 4 
    - - overwrite_cache 
    - - output_dir output 
    - - per_device_train_batch_size 8 
    - - gradient_accumulation_steps 4 
    - - lr_scheduler_type cosine 
    - - logging_steps 10 
    - - save_steps 1000 
    - - learning_rate 5e-5 
    - - num_train_epochs 2.0 
    - - plot_loss 
    - - fp16 
    - - template llama2 
    - - lora_target q_proj , v_proj

# LLaMA
accelerate launch src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - do_train 
    - - dataset mm , hm 
    - - finetuning_type lora 
    - - overwrite_cache 
    - - output_dir output - 1 
    - - per_device_train_batch_size 4 
    - - gradient_accumulation_steps 4 
    - - lr_scheduler_type cosine 
    - - logging_steps 10 
    - - save_steps 2000 
    - - learning_rate 5e-5 
    - - num_train_epochs 2.0 
    - - plot_loss 
    - - fp16 
    - - template default 
    - - lora_target q_proj , v_proj

강화 학습

 # LLaMA-2, DPO
accelerate launch src / train_bash . py 
    - - stage dpo 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_train 
    - - dataset rlhf 
    - - template llama2 
    - - finetuning_type lora 
    - - quantization_bit 4 
    - - lora_target q_proj , v_proj 
    - - resume_lora_training False 
    - - checkpoint_dir . / output - 2 
    - - output_dir output - dpo 
    - - per_device_train_batch_size 2 
    - - gradient_accumulation_steps 4 
    - - lr_scheduler_type cosine 
    - - logging_steps 10 
    - - save_steps 1000 
    - - learning_rate 1e-5 
    - - num_train_epochs 1.0 
    - - plot_loss 
    - - fp16

4. 추론 구성

추론 매개변수 및 지침

웹 접속

 # LLaMA-2
python src / web_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / web_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

# DPO
python src / web_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output - dpo 
    - - finetuning_type lora 
    - - template llama2

API 액세스

 # LLaMA-2
python src / api_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / api_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

# DPO
python src / api_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output - dpo 
    - - finetuning_type lora 
    - - template llama2

테스트 API:

 curl - X 'POST' 
    'http://127.0.0.1:8888/v1/chat/completions' 
    - H 'accept: application/json' 
    - H 'Content-Type: application/json' 
    - d ' {
    "model" : "string",
    "messages": [
      {
        "role" : "user",
        "content": "你好"
      }
    ],
    " temperature ": 0 ,
    "top_p" : 0 ,
    "max_new_tokens" : 0 ,
    "stream" : false
  }'

CLI 액세스

 # LLaMA-2
python src / cli_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / cli_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

# DPO
python src / cli_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output - dpo 
    - - finetuning_type lora 
    - - template llama2

일괄 예측

 # LLaMA-2
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_predict 
    - - dataset mm 
    - - template llama2 
    - - finetuning_type lora 
    - - checkpoint_dir output 
    - - output_dir predict_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

# LLaMA
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - do_predict 
    - - dataset mm 
    - - template default 
    - - finetuning_type lora 
    - - checkpoint_dir output - 1 
    - - output_dir predict_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

실험 평가(BLEU 및 ROUGE_CHINESE)

 # LLaMA-2
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_eval 
    - - dataset mm 
    - - template llama2 
    - - finetuning_type lora 
    - - checkpoint_dir output 
    - - output_dir eval_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

# LLaMA
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - do_eval 
    - - dataset mm 
    - - template default 
    - - finetuning_type lora 
    - - checkpoint_dir output - 1 
    - - output_dir eval_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

4/8비트 평가의 경우 --per_device_eval_batch_size=1 및 --max_target_length 128 사용하는 것이 좋습니다.

5.그라디오 배포

Gradio 배포 지침

모델 내보내기

 # LLaMA-2
python src / export_model . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - template llama2 
    - - finetuning_type lora 
    - - checkpoint_dir output - 1 
    - - output_dir output_export

# LLaMA
python src / export_model . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - template default 
    - - finetuning_type lora 
    - - checkpoint_dir output 
    - - output_dir output_export

달리기 시작

 % cd Gradio
python app . py

6.ChatGPT-Next-Web 배포

다음배포 지침

API 서비스 시작

 # LLaMA-2
python src / api_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / api_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

Next를 다운로드하고 실행하세요.

다운로드다음:

구성 수정: 다음을 설치하고 열고设置열고接口地址http://127.0.0.1:8000/ (즉, API 인터페이스 주소)으로 수정한 다음 사용할 수 있습니다.

?실제 경험

CareGPT에서는 중국어 단어 분할이 단어 분할 모델에 추가 및 재교육되지 않지만 효과는 여전히 유망합니다.
LLM 교육의 전체 프로세스에는 사전 교육, 지도 미세 조정, 보상 모델 및 강화 학습이 포함됩니다. 대부분의 경우 지도 미세 조정은 사용자의 요구 사항을 충족할 수 있습니다 .
컴퓨팅 성능이 충분할 경우 의료 데이터 및 일반 코퍼스 데이터를 훈련에 사용하는 것이 좋습니다. 그러면 모델이 의료 훈련 및 학습을 가질 수 있을 뿐만 아니라 일반 기능(예: 지침 따르기)도 유지할 수 있습니다.
하나의 의료 LLM이 모든 요구 사항을 충족할 수 있다고 기대하지 마십시오. 실시간으로 업데이트되는 지식 기반 + 미세 조정된 의료 LLM (예: ChatLaw)이 합리적인 접근 방식일 수 있습니다.
BLOOMZ 모델 시리즈는 PubMed Central 및 PubMed Abstracts 포함한 다양한 의학 텍스트가 포함된 PILE 코퍼스를 사용하여 학습되었습니다. 이러한 귀중한 텍스트는 BLOOMZ 모델의 의학 지식 시스템을 크게 풍부하게 하였으므로 많은 오픈 소스 프로젝트에서 BLOOMZ를 의료 미세 조정의 기본 모델로 우선시할 것입니다.
(2023.08.26) ChatGPT는 Code GPT를 기반으로 학습됩니다. LLaMA-1/2에서 미세 조정하는 것보다 더 나은 결과를 얻기 위해 CodeLLaMA를 사용하여 다운스트림 작업을 미세 조정합니까?
우리의 최근 작업과 최근 출판된 많은 작업을 결합하면 다음과 같은 사실이 입증됩니다. LLM 시대에는 데이터质量> 数量진실입니다. Qingyuan&& Caspian에 넘겨짐 | 미니GPT-4! , 매우 큰 규모의 SFT 데이터는 다운스트림 작업 LLM을 약화시키거나 ICL, CoT 및 기타 기능을 잃게 됩니다.
수직 모델의 경우 훈련을 위해 수천만 개의 SFT 데이터를 수집하는 대신 PT 프로세스에 더 많은 주의를 기울여야 할 것입니다. 우리의 제안은大规模预训练+小规模监督微调=超强的LLM模型.
좋은 사전 교육을 받은 의료 LLM은 아직 오픈 소스 커뮤니티에 공개되지 않았으며 누군가가 이러한 작업을 보완할 수 있기를 바랍니다.
사전 훈련은 지식을 주입할 수 있는 반면 감독된 미세 조정은 도메인 기능만 활성화합니다(지식에 집중할 수 없음)? 사전 훈련 지식은 감독된 미세 조정 지식을 반영해야 합니까? 수십 GB의 사전 훈련된 코퍼스 지식이 수조 개의 토큰에 대한 원래의 사전 훈련된 모델 지식에 압도될까요?
대용량 데이터의 2차 사전 학습에는 다양한 유형의 다른 데이터와의 매칭이 필요합니다. (1) 언어 모델 학습이 완료된 후 매개변수의 각 영역의 담당 부분이 결정됩니다. 사전 학습 중에 사용할 수 없는 매개변수가 추가되면 진폭 변경으로 인해 전체 언어 모델 기능이 손실됩니다. (2) 대규모 데이터의 2차 사전 학습의 경우 원본 데이터의 5~10배입니다. 사전 훈련을 추가하고, 혼합하고, 함께 훈련해야 합니다.
명령 미세 조정 단계에서는 너무 많은 훈련 라운드를 수행할 수 없습니다. (1) 소량의 데이터에 대해 여러 EPOCH를 훈련하면 언어의 주요 영역이 변경되어 전체 모델이 실패할 수 있습니다. -특정 작업 개선을 위한 조정, 모델 언어 기능의 핵심 영역이 크게 조정되지 않도록 하기 위해 일반 명령 미세 조정 데이터 또는 사전 훈련 데이터를 추가해야 합니다.
학습 데이터는 잡음을 엄격하게 제어해야 합니다. (1) 사전 학습 데이터에 단어의 연속적인 반복, 단어가 아닌 시퀀스 등 연속적인 잡음 데이터가 소량 있는 경우 특정 차원의 조정이 발생할 수 있습니다. 모델의 전체 PPL이 크게 변동하게 됩니다. (2) 지도된 미세 조정 명령에 원본 대형 언어 모델과 일치하지 않는 명령 조각이 많으면 모델이 특정 차원을 조정할 수도 있습니다. , 이로 인해 모델의 전반적인 성능이 크게 저하됩니다.
여러 기능이 혼합된 데이터로 대규모 모델을 미세 조정할 때 다음과 같은 현상이 나타납니다. 리소스 충돌이 높고 리소스 획득이 낮으므로 미세 조정을 위해 서로 다른 데이터를 혼합하려면 특정 엔지니어링 기술이 필요합니다.
일반적으로 lora와 전체 조정 간에는 무시할 수 없는 성능 차이가 있습니다(예: LoRA 결과는 전체 미세 조정에 비해 4~6% 낮은 성능을 나타냄).
7B 시리즈 모델의 경우 전체 매개변수 미세 조정 방법을 우선적으로 사용하십시오. 13B 이상의 매개변수 모델에는 LoRA, QLoRA 및 기타 방법을 사용할 수 있습니다.
매우 큰 매개변수 모델을 정량화하더라도 그 성능은 여전히 잘 유지될 수 있습니다.
LLM 훈련(또는 GPU에서 훈련된 모든 모델)에는 필연적인 무작위성이 있지만 다중 LUN 훈련의 결과는 여전히 매우 일관됩니다.
GPU 메모리로 인해 제한이 있는 경우 QLoRA는 비용 효율적인 절충안을 제공합니다. 실행 시간이 39% 증가하는 대신 33%의 메모리가 절약됩니다.
LLM을 미세 조정할 때 최적화 프로그램의 선택은 결과에 영향을 미치는 주요 요인이 아닙니다. AdamW, 스케줄러가 있는 SGD, 스케줄러가 있는 AdamW 등 결과에 미치는 영향은 최소화됩니다.
Adam은 각 모델 매개변수에 대해 두 개의 새로운 매개변수를 도입하기 때문에 종종 메모리 집약적인 최적화 프로그램으로 간주되지만 이는 LLM의 최대 메모리 요구 사항에 큰 영향을 미치지 않습니다. 이는 추가 매개변수를 보유하는 대신 대규모 행렬의 곱셈을 위해 대부분의 메모리가 할당되기 때문입니다.
정적 데이터 세트의 경우 여러 라운드의 교육과 같은 여러 반복이 제대로 작동하지 않을 수 있습니다. 이는 종종 과적합으로 이어져 훈련 결과를 악화시킵니다.
LoRA를 결합하려면 Key 및 Value 행렬뿐만 아니라 모든 레이어에 적용하여 모델 성능을 극대화해야 합니다.
LoRA 순위를 조정하고 적절한 α 값을 선택하는 것이 중요합니다. 약간의 트릭을 제공하려면 α 값을 순위 값의 두 배로 설정해 보십시오.
14GB RAM을 갖춘 단일 GPU는 70억 개의 매개변수가 포함된 대규모 모델을 몇 시간 내에 효율적으로 미세 조정할 수 있습니다. 정적 데이터 세트의 경우 LLM을 "만능"으로 강화하고 모든 기본 작업을 잘 수행하는 것은 불가능합니다. 이 문제를 해결하려면 다양한 데이터 소스나 LoRA 이외의 기술을 사용해야 합니다.
NeurIPS 워크샵의 권장 사항에 따르면 2023년 12월 18일 현재 미세 조정 모델의 권장 선택은英文10B以下选择Mistral-7B中文10B以下选择Yi-6B 10B以上选择Qwen-14B和Yi-34B ;

중요한

누구나 ISSUE에 새로운 경험을 추가할 수 있습니다!

11~13 방법론은 130억 개의 대규모 언어 모델에서 나옵니다. 가중치 하나만 변경하면 언어 능력이 완전히 상실됩니다! 푸단대학교 자연어처리연구소의 최신 연구입니다.

14대형 언어 모델의 능력이 감독된 미세 조정 데이터 구성에 의해 어떻게 영향을 받는지에 대한 방법론

17~25 방법론은 LLM Optimization: Layer-wise Optimal Rank Adaptation (LORA) 중국어 버전 해석에서 따옴

?모델 오픈 소스

단계	가중치 소개	주소 다운로드	특징	기본 모델	미세 조정 방법	데이터 세트
?감독 및 미세 조정	다중 회전 대화 데이터는 LLaMA2-7b-Chat을 기반으로 학습됩니다.	CareLlama2-7b-채팅-sft-멀티、?CareLlama2-7b-멀티	뛰어난 다단계 대화 능력	LLaMA2-7b-채팅	QLoRA	mm
미세 조정 감독	풍부하고 효율적인 의사-환자 대화 데이터는 LLaMA2-7b-Chat을 기반으로 훈련됩니다.	CareLlama2-7b-채팅-sft-med	우수한 환자 질병 진단 능력	LLaMA2-7b-채팅	QLoRA	흠
감독하다

확장하다

추가 정보

버전 1.0.0
유형 AI 소스 코드
업데이트 시간 2024-12-09
크기 22.13MB
출처 Github