Téléchargement CareGPT - Téléchargement du code source CareGPT

CareGPT

Code Source AI

1.0.0

Télécharger

Chinois | Anglais

Tutoriel vidéo Installation et déploiement Expérience en ligne

⚡Caractéristiques :

Ajout de la mise en œuvre du réglage fin de ChatGPT et recommandation d'amis avec des crédits pour mener des expériences de réglage fin sur ChatGPT ;
Prend en charge le modèle de réglage fin du déploiement ChatGPT-Next-Web ;
Prend en charge les modèles de réglage fin du déploiement Gradio ;
Prend en charge la formation des modèles de séries complètes LLaMA et LLaMA-2 ;
Prend en charge LoRA et QLoRA, y compris la formation ultérieure d'apprentissage par renforcement PPO et DPO ;
Prend en charge les questions et réponses combinées avec des modèles et une base de connaissances ;
Informations sur les documents d'orientation médicale open source pour plus de 60 services hospitaliers ;
Développement d'un outil pour prendre en charge la distillation du modèle GPT-4/ChatGPT de données médicales, qui peut générer par lots diverses données pour créer une base de connaissances et affiner ;
Il regroupe une multitude de LLM médicaux open source, de données médicales pour la formation LLM, de données de déploiement LLM, d'évaluation LLM et de collecte de ressources LLM associées ;
Nous avons participé à l'évaluation de la liste CMB des LLM médicaux - IvyGPT Dans le test, nous étions en avance sur ChatGPT et un certain nombre de LLM médicaux open source ;
Nous avons plusieurs LLM médicaux open source formés sur différents LLM de base basés sur nos propres ensembles de données. Vous pouvez les télécharger directement pour en faire l'expérience ;

?Ensemble de données

Données de pré-entraînement

LLM-Prétrain-FineTune/data_pretrain
MédicalGPT/pré-formation
zyj
TCM-Ancient-Books (près de 700 textes de médecine chinoise ancienne)
epfl-llm/lignes directrices

Données de formation supervisées

icliniq-10k(fr)
HealthCareMagic-100k(fr)
ShenNong_TCM_Dataset
✅ChatMed_Consult_Dataset
Données-de-dialogue-médical-chinois
cMedQA2
✅Huatuo-26M
cMedQA2
webMedQA
PubMedQA
CMCQA
✅QiZhenGPT
✅LLM-Pré-entraînement-FineTune/data_sft
Système de dialogue médical
IMCS-V2
CHIP-MDCFNPC
MedDG
✅HuatuoGPT-sft-data-v1
MédicalGPT/finetune
✅shibing624/médical
medAlpaca/données
✅Zhongjing/sft
dialogue_médical
huatuo_encyclopedia_qa
Med-ChatGLM/données
CMB
GenMedGPT-5k(fr)
Alpaga-CoT (général)
✅DISC-Med-SFT
✅HuatuoGPT2_sft_instruct
FreedomIntelligence/Medbase_data
openmedlab/Ensemble de données génial-médical

Récompenser les données de formation

MédicalGPT/récompense
Zhongjing/rw
comparaison_gpt4_data
HH-RLHF
UltraCommentaires

?️Formation complète sur les processus

1. Installer les dépendances

 conda create - n llm python = 3.11
conda activate llm
python - m pip install - r requirements . txt

Téléchargement du modèle LLaMA : https://blog.csdn.net/u014297502/article/details/129829677

 # 转为HF格式
python - m transformers . models . llama . convert_llama_weights_to_hf 
    - - input_dir path_to_llama_weights - - model_size 7 B - - output_dir path_to_llama_model

Téléchargement du modèle LLaMA-2 : https://huggingface.co/meta-llama

2.Configuration des données

Configuration de l'ensemble de données, format de données PT, SFT, RW

dataset_info

Si vous utilisez un ensemble de données personnalisé, assurez-vous de fournir la définition de votre ensemble de données dans le fichier dataset_info.json au format suivant.

 "数据集名称" : {
  "hf_hub_url" : " HuggingFace上的项目地址（若指定，则忽略下列三个参数） " ,
  "script_url" : "包含数据加载脚本的本地文件夹名称（若指定，则忽略下列两个参数） " ,
  "file_name" : "该目录下数据集文件的名称（若上述参数未指定，则此项必需） " ,
  "file_sha1" : "数据集文件的SHA-1哈希值（可选） " ,
  "columns" : {
    "prompt" : "数据集代表提示词的表头名称（默认：instruction） " ,
    "query" : "数据集代表请求的表头名称（默认：input） " ,
    "response" : "数据集代表回答的表头名称（默认：output） " ,
    "history" : "数据集代表历史对话的表头名称（默认：None） "
  }
}

Les colonnes prompt et response doivent être des chaînes non vides. Le contenu de la colonne query sera concaténé avec la colonne prompt en tant qu'entrée du modèle. La colonne history doit être une liste, où chaque élément est un tuple de chaîne représentant respectivement la demande de l'utilisateur et la réponse du modèle.

Exemples de données PT

Format .txt , une donnée non supervisée par ligne.

Machine learning (ML) is a field devoted to understanding and building methods that let machines "learn" – that is, methods that leverage data to improve computer performance on some set of tasks.
Machine learning algorithms build a model based on sample data, known as training data, in order to make predictions or decisions without being explicitly programmed to do so. Machine learning algorithms are used in a wide variety of applications, such as in medicine, email filtering, speech recognition, agriculture, and computer vision, where it is difficult or unfeasible to develop conventional algorithms to perform the needed tasks.

Exemple de données SFT 1

[
  {
    "instruction" : "听起来很不错。人工智能可能在哪些方面面临挑战呢？ " ,
    "input" : " " ,
    "output" : "人工智能面临的挑战包括数据隐私、安全和道德方面的问题，以及影响就业机会的自动化等问题。 " ,
    "history" : [
      [ "你好，你能帮我解答一个问题吗？ " , "当然，请问有什么问题？ " ],
      [ "我想了解人工智能的未来发展方向，你有什么想法吗？ " , "人工智能在未来的发展方向可能包括更强大的机器学习算法，更先进的自然语言处理技术，以及更加智能的机器人。 " ]
    ]
  }
]

Exemple de données SFT 2

[
  {
    "instruction" : "听起来很不错。人工智能可能在哪些方面面临挑战呢？ " ,
    "input" : " " ,
    "output" : "人工智能面临的挑战包括数据隐私、安全和道德方面的问题，以及影响就业机会的自动化等问题。 " ,
    "history" : []
  }
]

Exemple de données RW

[
  {
    "instruction" : "生成三个与“道歉”意思相同的动词" ,
    "input" : " " ,
    "output" : [
      "承认，表示遗憾，弥补。 " ,
      "道歉"
    ]
  }
]

3. Paramétrage de la formation

Paramètres et instructions de formation

Configurer distribué

Vérifiez si votre carte graphique est connectée à NVLINK. Ce n'est qu'avec la connexion NVLINK que vous pouvez utiliser efficacement accelerate pour un entraînement accéléré en parallèle.

 nvidia-smi topo -m

 accelerate config # configure the environment
accelerate launch src / train_bash . py # arguments (same as above)

Formation supervisée

 # LLaMA-2
accelerate launch src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_train 
    - - dataset mm 
    - - finetuning_type lora 
    - - quantization_bit 4 
    - - overwrite_cache 
    - - output_dir output 
    - - per_device_train_batch_size 8 
    - - gradient_accumulation_steps 4 
    - - lr_scheduler_type cosine 
    - - logging_steps 10 
    - - save_steps 1000 
    - - learning_rate 5e-5 
    - - num_train_epochs 2.0 
    - - plot_loss 
    - - fp16 
    - - template llama2 
    - - lora_target q_proj , v_proj

# LLaMA
accelerate launch src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - do_train 
    - - dataset mm , hm 
    - - finetuning_type lora 
    - - overwrite_cache 
    - - output_dir output - 1 
    - - per_device_train_batch_size 4 
    - - gradient_accumulation_steps 4 
    - - lr_scheduler_type cosine 
    - - logging_steps 10 
    - - save_steps 2000 
    - - learning_rate 5e-5 
    - - num_train_epochs 2.0 
    - - plot_loss 
    - - fp16 
    - - template default 
    - - lora_target q_proj , v_proj

apprentissage par renforcement

 # LLaMA-2, DPO
accelerate launch src / train_bash . py 
    - - stage dpo 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_train 
    - - dataset rlhf 
    - - template llama2 
    - - finetuning_type lora 
    - - quantization_bit 4 
    - - lora_target q_proj , v_proj 
    - - resume_lora_training False 
    - - checkpoint_dir . / output - 2 
    - - output_dir output - dpo 
    - - per_device_train_batch_size 2 
    - - gradient_accumulation_steps 4 
    - - lr_scheduler_type cosine 
    - - logging_steps 10 
    - - save_steps 1000 
    - - learning_rate 1e-5 
    - - num_train_epochs 1.0 
    - - plot_loss 
    - - fp16

4. Configuration de l'inférence

Paramètres et instructions d'inférence

Accès Internet

 # LLaMA-2
python src / web_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / web_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

# DPO
python src / web_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output - dpo 
    - - finetuning_type lora 
    - - template llama2

Accès aux API

 # LLaMA-2
python src / api_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / api_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

# DPO
python src / api_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output - dpo 
    - - finetuning_type lora 
    - - template llama2

API de test :

 curl - X 'POST' 
    'http://127.0.0.1:8888/v1/chat/completions' 
    - H 'accept: application/json' 
    - H 'Content-Type: application/json' 
    - d ' {
    "model" : "string",
    "messages": [
      {
        "role" : "user",
        "content": "你好"
      }
    ],
    " temperature ": 0 ,
    "top_p" : 0 ,
    "max_new_tokens" : 0 ,
    "stream" : false
  }'

Accès CLI

 # LLaMA-2
python src / cli_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / cli_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

# DPO
python src / cli_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output - dpo 
    - - finetuning_type lora 
    - - template llama2

Prédiction par lots

 # LLaMA-2
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_predict 
    - - dataset mm 
    - - template llama2 
    - - finetuning_type lora 
    - - checkpoint_dir output 
    - - output_dir predict_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

# LLaMA
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - do_predict 
    - - dataset mm 
    - - template default 
    - - finetuning_type lora 
    - - checkpoint_dir output - 1 
    - - output_dir predict_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

Évaluation expérimentale (BLEU et ROUGE_CHINESE)

 # LLaMA-2
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_eval 
    - - dataset mm 
    - - template llama2 
    - - finetuning_type lora 
    - - checkpoint_dir output 
    - - output_dir eval_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

# LLaMA
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - do_eval 
    - - dataset mm 
    - - template default 
    - - finetuning_type lora 
    - - checkpoint_dir output - 1 
    - - output_dir eval_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

Pour une évaluation 4/8 bits, il est recommandé d'utiliser --per_device_eval_batch_size=1 et --max_target_length 128

5.Déploiement Gradio

Instructions de déploiement du Gradio

Exportation de modèle

 # LLaMA-2
python src / export_model . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - template llama2 
    - - finetuning_type lora 
    - - checkpoint_dir output - 1 
    - - output_dir output_export

# LLaMA
python src / export_model . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - template default 
    - - finetuning_type lora 
    - - checkpoint_dir output 
    - - output_dir output_export

Commencez à courir

 % cd Gradio
python app . py

6.Déploiement ChatGPT-Next-Web

Instructions de déploiement suivant

Démarrer le service API

 # LLaMA-2
python src / api_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / api_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

Téléchargez Suivant et exécutez

TéléchargerSuivant :

Modifier la configuration : installez et ouvrez Next, puis ouvrez设置, modifiez接口地址en : http://127.0.0.1:8000/ (c'est-à-dire l'adresse de votre interface API), et vous pourrez ensuite l'utiliser.

?Expérience pratique

Dans CareGPT, la segmentation des mots chinois n'est pas ajoutée ni recyclée au modèle de segmentation des mots, mais l'effet est toujours prometteur ;
L'ensemble du processus de formation LLM comprend : la pré-formation, le réglage fin supervisé, le modèle de récompense et l'apprentissage par renforcement. Dans la plupart des cas, le réglage fin supervisé peut répondre à vos propres besoins ;
Lorsque la puissance de calcul est suffisante, il est recommandé d'utiliser des données médicales et des données générales du corpus pour la formation , afin que le modèle puisse non seulement avoir une formation et un apprentissage médicaux, mais également maintenir des capacités générales (telles que suivre des instructions) ;
Ne vous attendez pas à ce qu’un LLM médical puisse répondre à tous les besoins. Une approche raisonnable peut être une base de connaissances mise à jour en temps réel + un LLM médical affiné (comme ChatLaw) ;
La série de modèles BLOOMZ a été formée à l'aide du corpus PILE, qui contient divers textes médicaux, notamment PubMed Central et PubMed Abstracts . Ces textes précieux ont considérablement enrichi le système de connaissances médicales du modèle BLOOMZ, c'est pourquoi de nombreux projets open source donneront la priorité à BLOOMZ comme modèle de base pour le réglage médical ;
(2023.08.26) ChatGPT est formé sur la base du Code GPT. Allons-nous utiliser CodeLLaMA pour affiner les tâches en aval afin d'obtenir de meilleurs résultats que le réglage fin sur LLaMA-1/2 ?
La combinaison de nos travaux récents avec de nombreux travaux récemment publiés prouve : à l'ère du LLM,质量> 数量est la vérité, comme : Moins c'est plus ! Remis à Qingyuan&& Caspian | MiniGPT-4 ! , les données SFT à très grande échelle affaibliront la tâche en aval LLM ou perdront ICL, CoT et d'autres capacités ;
Pour les modèles verticaux, nous devrions peut-être accorder plus d'attention au processus PT au lieu de collecter des dizaines de millions de données SFT pour la formation. Notre suggestion est大规模预训练+小规模监督微调=超强的LLM模型;
Un bon LLM médical pré-formé n'a pas encore été ouvert dans la communauté open source, et j'espère que quelqu'un pourra compléter un tel travail ;
La pré-formation peut insuffler des connaissances, tandis que le réglage fin supervisé n'active que les capacités du domaine (ne peut pas se concentrer sur les connaissances) ? Les connaissances préalables à la formation doivent-elles faire écho aux connaissances de mise au point supervisées ? Les dizaines de Go de connaissances de corpus pré-entraînées seront-elles submergées par la connaissance originale du modèle pré-entraîné de milliards de jetons ?
La pré-formation secondaire d'une grande quantité de données nécessite la mise en correspondance de divers types d'autres données : (1) Une fois la formation du modèle de langage terminée, les parties responsables de chaque domaine des paramètres ont été déterminées si une grande quantité de connaissances. qui n'est pas disponible pendant la pré-formation est ajouté, les paramètres augmenteront. Les changements d'amplitude entraîneront la perte de l'intégralité de la capacité du modèle de langage (2) Pour la pré-formation secondaire de données à grande échelle, 5 à 10 fois les données de l'original ; la pré-formation doit être ajoutée, mélangée et formée ensemble ;
La phase de réglage fin de l'instruction ne peut pas effectuer trop de cycles de formation : (1) La formation de plusieurs EPOCH sur une petite quantité de données peut entraîner des changements dans des domaines clés du langage, conduisant à l'échec de l'ensemble du modèle ; -réglage pour des améliorations de tâches spécifiques, Afin de garantir que les domaines clés des capacités linguistiques du modèle ne sont pas ajustés de manière significative, il est nécessaire d'ajouter des données de réglage fin des instructions générales ou des données de pré-formation ;
Les données de formation doivent contrôler strictement le bruit : (1) S'il y a une petite quantité de données de bruit continues dans les données de pré-formation, telles que la répétition continue de mots, des séquences sans mots, etc., cela peut entraîner des ajustements dans des dimensions spécifiques, provoquant une fluctuation significative du PPL global du modèle ; (2) S'il y a un grand nombre de fragments d'instructions dans les instructions de réglage fin supervisé qui ne correspondent pas au grand modèle de langage d'origine, cela peut également amener le modèle à ajuster des dimensions spécifiques. , réduisant ainsi considérablement les performances globales du modèle ;
Lors du réglage fin d'un grand modèle avec des données mixtes de plusieurs capacités, il apparaîtra : un conflit de ressources élevé et un faible gain de ressources, donc le mélange de différentes données pour un réglage fin nécessite certaines compétences en ingénierie ;
De manière générale, il existe une différence de performances non négligeable entre lora et le réglage complet (par exemple, LoRA entraîne des performances inférieures de 4 à 6 % par rapport au réglage fin complet) ;
Veuillez donner la priorité à la méthode de réglage fin des paramètres complets pour les modèles de la série 7B. LoRA, QLoRA et d'autres méthodes peuvent être utilisées pour les modèles à paramètres 13B et supérieurs ;
Même si un modèle à très grands paramètres est quantifié, ses capacités peuvent toujours être bien maintenues ;
Bien que la formation LLM (ou tous les modèles formés sur GPU) comporte un caractère inévitablement aléatoire, les résultats de la formation multi-lun sont toujours très cohérents ;
Si vous êtes limité par la mémoire GPU, QLoRA constitue un compromis rentable. Il permet d'économiser 33 % de mémoire au prix d'une augmentation de 39 % du temps d'exécution ;
Lors du réglage fin du LLM, le choix de l'optimiseur n'est pas le principal facteur affectant les résultats. Qu'il s'agisse d'AdamW, SGD avec planificateur, ou d'AdamW avec planificateur, l'impact sur les résultats est minime ;
Bien qu'Adam soit souvent considéré comme un optimiseur gourmand en mémoire car il introduit deux nouveaux paramètres pour chaque paramètre de modèle, cela n'affecte pas de manière significative les besoins maximaux en mémoire de LLM. En effet, la majeure partie de la mémoire sera allouée à la multiplication de grandes matrices plutôt qu'à la conservation de paramètres supplémentaires ;
Pour les ensembles de données statiques, plusieurs itérations, comme plusieurs cycles de formation, peuvent ne pas fonctionner correctement. Cela conduit souvent à un surentraînement et à une détérioration des résultats d'entraînement ;
Si vous souhaitez combiner LoRA, assurez-vous qu'elle est appliquée sur toutes les couches, pas seulement sur la matrice Clé et Valeur, afin de maximiser les performances du modèle ;
Il est crucial d’ajuster le rang LoRA et de choisir une valeur α appropriée. Pour fournir une petite astuce, essayez de définir la valeur α sur deux fois la valeur de classement ;
Un seul GPU avec 14 Go de RAM peut affiner efficacement un grand modèle avec 7 milliards de paramètres en quelques heures. Pour les ensembles de données statiques, il est impossible de renforcer le LLM pour en faire un outil « polyvalent » et performant dans toutes les tâches de base. Résoudre ce problème nécessite des sources de données diversifiées ou le recours à d’autres technologies que LoRA ;
Selon les recommandations de l'atelier NeurIPS, au 18 décembre 2023, la sélection recommandée de modèles affinés英文10B以下选择Mistral-7B中文, 10B以下选择Yi-6B 10B, et 10B以上选择Qwen-14B和Yi-34B ;

Important

Tout le monde est invité à ajouter de nouvelles expériences à ISSUE !

La méthodologie 11~13 provient de 13 milliards de grands modèles de langage. Changer un seul poids fera perdre complètement la capacité du langage ! Les dernières recherches du Laboratoire de traitement du langage naturel de l'Université de Fudan.

14Méthodologie de la façon dont les capacités dans les grands modèles linguistiques sont affectées par la composition des données de réglage fin supervisé

La méthodologie 17 ~ 25 provient de l'optimisation LLM : interprétation de la version chinoise de l'adaptation de rang optimal par couche (LORA)

?Modèle open source

scène	Introduction aux poids	Adresse de téléchargement	Caractéristiques	modèle de base	méthode de réglage fin	Ensemble de données
?Supervision et mise au point	Les données de dialogue multi-tours sont formées sur la base de LLaMA2-7b-Chat	CareLlama2-7b-chat-sft-multi、?CareLlama2-7b-multi	Excellentes compétences en conversation à plusieurs tours	LLaMA2-7b-Chat	QLoRA	mm
Superviser la mise au point	Des données de dialogue médecin-patient riches et efficaces sont formées sur la base de LLaMA2-7b-Chat	CareLlama2-7b-chat-sft-med	Excellentes capacités de diagnostic des maladies des patients	LLaMA2-7b-Chat	QLoRA	hum
superviser

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2024-12-09
taille 22.13MB
Provenant de Github

Applications connexes

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
node telegram bot api

Code Source AI

v0.50.0
typebot.io

Code Source AI

v3.1.2
python wechaty getting started

Code Source AI

1.0.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout