Загрузка CareGPT - Загрузка исходного кода CareGPT

китайский | английский

Видеоурок Установка и развертывание Онлайн-опыт

⚡Особенности:

Добавлена реализация тонкой настройки ChatGPT и рекомендованы друзьям с кредитами для проведения экспериментов по тонкой настройке ChatGPT;
Поддерживает модель тонкой настройки развертывания ChatGPT-Next-Web;
Поддерживает модели точной настройки развертывания Gradio;
Поддерживает обучение моделей полной серии LLaMA и LLaMA-2;
Поддерживает LoRA и QLoRA, включая последующее обучение с подкреплением PPO и DPO;
Поддерживает вопросы и ответы в сочетании с моделями и базой знаний;
Медицинские руководящие материалы из открытых источников для более чем 60 больничных отделений;
Разработан инструмент для поддержки фильтрации медицинских данных по модели GPT-4/ChatGPT, который может пакетно генерировать различные данные для построения базы знаний и тонкой настройки;
Он объединяет множество медицинских LLM с открытым исходным кодом, медицинских данных для обучения LLM, данных о развертывании LLM, оценки LLM и сбора соответствующих ресурсов LLM;
Мы участвовали в оценке медицинских LLM по списку CMB — IvyGPT. В тесте мы опередили ChatGPT и ряд медицинских LLM с открытым исходным кодом;
У нас есть несколько медицинских LLM с открытым исходным кодом, обученных на различных базовых LLM на основе наших собственных наборов данных. Вы можете загрузить их непосредственно, чтобы испытать;

?Набор данных

Данные перед тренировкой

LLM-Pretrain-FineTune/data_pretrain
МедицинскийGPT/предварительная подготовка
зый
Древние книги ТКМ (около 700 текстов по древней китайской медицине)
epfl-llm/руководящие принципы

Данные контролируемого обучения

icliniq-10k(ru)
HealthCareMagic-100k(ru)
ShenNong_TCM_Dataset
✅ChatMed_Consult_Dataset
Данные китайского медицинского диалога
cMedQA2
✅Хуатуо-26М
cMedQA2
вебМедQA
ПабМедQA
CMCQA
✅ЦиЖенGPT
✅LLM-Pretrain-FineTune/data_sft
Медицинская Диалоговая Система
ИМКС-В2
ЧИП-MDCFNPC
МедГД
✅HuatuoGPT-sft-data-v1
МедицинскийGPT/тонкая настройка
✅shibing624/медицинский
medAlpaca/данные
✅Чжунцзин/ЮВТ
медицинский_диалог
huatuo_encyclepedia_qa
Мед-ЧатGLM/данные
СМБ
ГенМедГПТ-5к(ru)
Альпака-CoT(общий)
✅ДИСК-Мед-СФТ
✅HuatuoGPT2_sft_instruct
FreedomIntelligence/Medbase_data
openmedlab/Awesome-Medical-Dataset

Данные о вознаграждении за обучение

МедицинскийGPT/награда
Чжунцзин/RW
сравнение_gpt4_data
HH-RLHF
Ультраобратная связь

?️Полное обучение процессу

1. Установите зависимости

 conda create - n llm python = 3.11
conda activate llm
python - m pip install - r requirements . txt

Загрузка модели LLaMA: https://blog.csdn.net/u014297502/article/details/129829677

 # 转为HF格式
python - m transformers . models . llama . convert_llama_weights_to_hf 
    - - input_dir path_to_llama_weights - - model_size 7 B - - output_dir path_to_llama_model

Скачать модель LLaMA-2: https://huggingface.co/meta-llama

2. Конфигурация данных

Конфигурация набора данных, формат данных PT, SFT, RW

dataset_info

Если вы используете собственный набор данных, обязательно укажите определение набора данных в файле dataset_info.json в следующем формате.

 "数据集名称" : {
  "hf_hub_url" : " HuggingFace上的项目地址（若指定，则忽略下列三个参数） " ,
  "script_url" : "包含数据加载脚本的本地文件夹名称（若指定，则忽略下列两个参数） " ,
  "file_name" : "该目录下数据集文件的名称（若上述参数未指定，则此项必需） " ,
  "file_sha1" : "数据集文件的SHA-1哈希值（可选） " ,
  "columns" : {
    "prompt" : "数据集代表提示词的表头名称（默认：instruction） " ,
    "query" : "数据集代表请求的表头名称（默认：input） " ,
    "response" : "数据集代表回答的表头名称（默认：output） " ,
    "history" : "数据集代表历史对话的表头名称（默认：None） "
  }
}

Столбцы prompt и response не должны быть пустыми строками. Содержимое столбца query будет объединено со столбцом prompt в качестве входных данных модели. Столбец history должен представлять собой список, где каждый элемент представляет собой строковый кортеж, представляющий запрос пользователя и ответ модели соответственно.

Пример данных PT

Формат .txt , по одному неконтролируемому данным в строке.

Machine learning (ML) is a field devoted to understanding and building methods that let machines "learn" – that is, methods that leverage data to improve computer performance on some set of tasks.
Machine learning algorithms build a model based on sample data, known as training data, in order to make predictions or decisions without being explicitly programmed to do so. Machine learning algorithms are used in a wide variety of applications, such as in medicine, email filtering, speech recognition, agriculture, and computer vision, where it is difficult or unfeasible to develop conventional algorithms to perform the needed tasks.

Пример данных SFT 1

[
  {
    "instruction" : "听起来很不错。人工智能可能在哪些方面面临挑战呢？ " ,
    "input" : " " ,
    "output" : "人工智能面临的挑战包括数据隐私、安全和道德方面的问题，以及影响就业机会的自动化等问题。 " ,
    "history" : [
      [ "你好，你能帮我解答一个问题吗？ " , "当然，请问有什么问题？ " ],
      [ "我想了解人工智能的未来发展方向，你有什么想法吗？ " , "人工智能在未来的发展方向可能包括更强大的机器学习算法，更先进的自然语言处理技术，以及更加智能的机器人。 " ]
    ]
  }
]

Пример данных SFT 2

[
  {
    "instruction" : "听起来很不错。人工智能可能在哪些方面面临挑战呢？ " ,
    "input" : " " ,
    "output" : "人工智能面临的挑战包括数据隐私、安全和道德方面的问题，以及影响就业机会的自动化等问题。 " ,
    "history" : []
  }
]

Пример данных RW

[
  {
    "instruction" : "生成三个与“道歉”意思相同的动词" ,
    "input" : " " ,
    "output" : [
      "承认，表示遗憾，弥补。 " ,
      "道歉"
    ]
  }
]

3. Конфигурация обучения

Параметры тренировки и инструкции

Настройка распределенного

Проверьте, подключена ли ваша видеокарта к NVLINK. Только при подключении NVLINK вы сможете эффективно использовать accelerate для параллельного ускоренного обучения.

 nvidia-smi topo -m

 accelerate config # configure the environment
accelerate launch src / train_bash . py # arguments (same as above)

Контролируемое обучение

 # LLaMA-2
accelerate launch src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_train 
    - - dataset mm 
    - - finetuning_type lora 
    - - quantization_bit 4 
    - - overwrite_cache 
    - - output_dir output 
    - - per_device_train_batch_size 8 
    - - gradient_accumulation_steps 4 
    - - lr_scheduler_type cosine 
    - - logging_steps 10 
    - - save_steps 1000 
    - - learning_rate 5e-5 
    - - num_train_epochs 2.0 
    - - plot_loss 
    - - fp16 
    - - template llama2 
    - - lora_target q_proj , v_proj

# LLaMA
accelerate launch src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - do_train 
    - - dataset mm , hm 
    - - finetuning_type lora 
    - - overwrite_cache 
    - - output_dir output - 1 
    - - per_device_train_batch_size 4 
    - - gradient_accumulation_steps 4 
    - - lr_scheduler_type cosine 
    - - logging_steps 10 
    - - save_steps 2000 
    - - learning_rate 5e-5 
    - - num_train_epochs 2.0 
    - - plot_loss 
    - - fp16 
    - - template default 
    - - lora_target q_proj , v_proj

обучение с подкреплением

 # LLaMA-2, DPO
accelerate launch src / train_bash . py 
    - - stage dpo 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_train 
    - - dataset rlhf 
    - - template llama2 
    - - finetuning_type lora 
    - - quantization_bit 4 
    - - lora_target q_proj , v_proj 
    - - resume_lora_training False 
    - - checkpoint_dir . / output - 2 
    - - output_dir output - dpo 
    - - per_device_train_batch_size 2 
    - - gradient_accumulation_steps 4 
    - - lr_scheduler_type cosine 
    - - logging_steps 10 
    - - save_steps 1000 
    - - learning_rate 1e-5 
    - - num_train_epochs 1.0 
    - - plot_loss 
    - - fp16

4. Конфигурация вывода

Параметры вывода и инструкции

Веб-доступ

 # LLaMA-2
python src / web_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / web_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

# DPO
python src / web_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output - dpo 
    - - finetuning_type lora 
    - - template llama2

Доступ через API

 # LLaMA-2
python src / api_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / api_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

# DPO
python src / api_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output - dpo 
    - - finetuning_type lora 
    - - template llama2

Тестовый API:

 curl - X 'POST' 
    'http://127.0.0.1:8888/v1/chat/completions' 
    - H 'accept: application/json' 
    - H 'Content-Type: application/json' 
    - d ' {
    "model" : "string",
    "messages": [
      {
        "role" : "user",
        "content": "你好"
      }
    ],
    " temperature ": 0 ,
    "top_p" : 0 ,
    "max_new_tokens" : 0 ,
    "stream" : false
  }'

Доступ через интерфейс командной строки

 # LLaMA-2
python src / cli_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / cli_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

# DPO
python src / cli_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output - dpo 
    - - finetuning_type lora 
    - - template llama2

Пакетное прогнозирование

 # LLaMA-2
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_predict 
    - - dataset mm 
    - - template llama2 
    - - finetuning_type lora 
    - - checkpoint_dir output 
    - - output_dir predict_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

# LLaMA
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - do_predict 
    - - dataset mm 
    - - template default 
    - - finetuning_type lora 
    - - checkpoint_dir output - 1 
    - - output_dir predict_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

Экспериментальная оценка (BLEU и ROUGE_CHINESE)

 # LLaMA-2
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_eval 
    - - dataset mm 
    - - template llama2 
    - - finetuning_type lora 
    - - checkpoint_dir output 
    - - output_dir eval_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

# LLaMA
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - do_eval 
    - - dataset mm 
    - - template default 
    - - finetuning_type lora 
    - - checkpoint_dir output - 1 
    - - output_dir eval_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

Для 4/8-битной оценки рекомендуется использовать --per_device_eval_batch_size=1 и --max_target_length 128

5. Развертывание радио

Инструкции по развертыванию Gradio

Экспорт модели

 # LLaMA-2
python src / export_model . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - template llama2 
    - - finetuning_type lora 
    - - checkpoint_dir output - 1 
    - - output_dir output_export

# LLaMA
python src / export_model . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - template default 
    - - finetuning_type lora 
    - - checkpoint_dir output 
    - - output_dir output_export

Начни бежать

 % cd Gradio
python app . py

6. Развертывание ChatGPT-Next-Web

Следующие инструкции по развертыванию

Запустить службу API

 # LLaMA-2
python src / api_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / api_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

Скачайте Далее и запустите

СкачатьДалее:

Измените конфигурацию: установите и откройте «Далее», затем откройте设置, измените接口地址на: http://127.0.0.1:8000/ (то есть адрес вашего интерфейса API), и затем вы сможете его использовать.

?Практический опыт

В CareGPT сегментация китайских слов не добавляется и не переобучается в модель сегментации слов, но эффект по-прежнему многообещающий;
Весь процесс обучения LLM включает в себя: предварительное обучение, контролируемую тонкую настройку, модель вознаграждения и обучение с подкреплением. В большинстве случаев контролируемая тонкая настройка может удовлетворить ваши собственные потребности ;
Когда вычислительной мощности достаточно, рекомендуется использовать для обучения медицинские данные и общие данные корпуса , чтобы модель могла не только иметь медицинскую подготовку и обучение, но и поддерживать общие возможности (например, следовать инструкциям);
Не ожидайте, что один медицинский LLM сможет удовлетворить все потребности. Разумным подходом может быть обновляемая в режиме реального времени база знаний + точно настроенная медицинская LLM (например, ChatLaw);
Серия моделей BLOOMZ была обучена с использованием корпуса PILE, который содержит различные медицинские тексты, включая PubMed Central и PubMed Abstracts . Эти ценные тексты значительно обогатили систему медицинских знаний модели BLOOMZ, поэтому многие проекты с открытым исходным кодом будут отдавать приоритет BLOOMZ как базовой модели для точной медицинской настройки;
(2023.08.26) ChatGPT обучен на основе Code GPT. Будем ли мы использовать CodeLLaMA для точной настройки последующих задач для достижения лучших результатов, чем тонкая настройка на LLaMA-1/2?
Объединение нашей недавней работы со многими недавно опубликованными работами доказывает: В эпоху LLM质量> 数量является истиной, например: Меньше значит больше! МиниGPT-4 ! сверхкрупномасштабные данные SFT ослабят LLM последующих задач или потеряют ICL, CoT и другие возможности;
Для вертикальных моделей, возможно, нам следует уделять больше внимания процессу PT вместо сбора десятков миллионов данных SFT для обучения. Наше предложение —大规模预训练+小规模监督微调=超强的LLM模型;
В open source-сообществе пока не открыт хороший медицинский LLM с предварительной подготовкой, и я надеюсь, что кто-то сможет дополнить такую работу;
Предварительное обучение может привнести знания, в то время как контролируемая точная настройка только активирует возможности предметной области (не может сосредоточиться на знаниях)? Должны ли знания, полученные до обучения, повторять знания, полученные при контролируемой настройке? Будут ли десятки ГБ предварительно обученных корпусных знаний перегружены исходными предварительно обученными модельными знаниями о триллионах токенов?
Вторичное предварительное обучение большого объема данных требует сопоставления различных типов других данных: (1) После завершения обучения языковой модели были определены ответственные части каждой области параметров, если имеется большой объем знаний. что недоступно во время предварительного обучения, параметры будут увеличиваться. Изменения амплитуды приводят к потере всей возможности языковой модели. (2) Для вторичного предварительного обучения крупномасштабных данных в 5-10 раз больше данных в оригинале; предварительную подготовку нужно добавлять, смешивать и тренировать вместе;
На этапе тонкой настройки инструкций не может проводиться слишком много раундов обучения: (1) Обучение нескольких EPOCH на небольшом объеме данных может вызвать изменения в ключевых областях языка, что приведет к сбою всей модели; (2) Штраф за обучение; -настройка для улучшения конкретных задач. Чтобы гарантировать, что ключевые области языковых возможностей модели не будут существенно скорректированы, необходимо добавить общие данные тонкой настройки инструкций или данные предварительного обучения;
Данные обучения должны строго контролировать шум: (1) Если в данных перед обучением имеется небольшое количество данных о непрерывном шуме, таких как непрерывное повторение слов, последовательности, не состоящие из слов, и т. д., это может привести к корректировкам конкретных измерений. вызывая значительные колебания общего PPL модели (2) Если в контролируемых инструкциях точной настройки имеется большое количество фрагментов инструкций, которые не соответствуют исходной модели большого языка, это также может привести к корректировке конкретных размеров модели; , тем самым существенно снижая общую производительность модели;
При точной настройке большой модели со смешанными данными нескольких возможностей возникнет: высокий конфликт ресурсов и низкий прирост ресурсов, поэтому смешивание разных данных для точной настройки требует определенных инженерных навыков;
Вообще говоря, существует значительная разница в производительности между lora и полной настройкой (например, LoRA приводит к снижению производительности на 4-6% по сравнению с полной точной настройкой);
Пожалуйста, отдайте приоритет методу точной настройки полного параметра для моделей серии 7B, QLoRA и другие методы могут использоваться для моделей с параметрами 13B и выше;
Даже если модель с очень большими параметрами определена количественно, ее возможности все равно можно хорошо поддерживать;
Хотя обучение LLM (или все модели, обученные на графическом процессоре) неизбежно имеют случайность, результаты обучения на нескольких лунах по-прежнему очень последовательны;
Если вы ограничены объемом памяти графического процессора, QLoRA предлагает экономически эффективный компромисс. Это экономит 33% памяти за счет увеличения времени работы на 39%;
При тонкой настройке LLM выбор оптимизатора не является основным фактором, влияющим на результаты. Будь то AdamW, SGD с планировщиком или AdamW с планировщиком, влияние на результаты минимально;
Хотя Адама часто считают оптимизатором, интенсивно использующим память, поскольку он вводит два новых параметра для каждого параметра модели, это не оказывает существенного влияния на пиковые требования к памяти LLM. Это связано с тем, что большая часть памяти будет выделена для умножения больших матриц, а не для хранения дополнительных параметров;
Для статических наборов данных несколько итераций, например несколько раундов обучения, могут оказаться неэффективными. Это часто приводит к переобучению, ухудшению результатов тренировок;
Если вы хотите объединить LoRA, убедитесь, что он применяется ко всем слоям, а не только к матрице ключей и значений, чтобы максимизировать производительность модели;
Крайне важно скорректировать ранг LoRA и выбрать подходящее значение α. Чтобы воспользоваться небольшой хитростью, попробуйте установить значение α в два раза больше значения ранга;
Один графический процессор с 14 ГБ оперативной памяти может эффективно настроить большую модель с 7 миллиардами параметров за несколько часов. Для статических наборов данных невозможно превратить LLM в «универсал» и хорошо выполнять все базовые задачи. Решение этой проблемы требует диверсификации источников данных или использования технологий, отличных от LoRA;
Согласно рекомендациям мастерской NeurIPS, по состоянию на 18 декабря 2023 года рекомендуемый выбор доработанных моделей英文10B以下选择Mistral-7B中文, 10B以下选择Yi-6B 10B, а также 10B以上选择Qwen-14B和Yi-34B ;

Важный

Приглашаем всех желающих добавить в ISSUE новые впечатления!

11~13 Методика основана на 13 миллиардах больших языковых моделей. Изменение всего лишь одного веса приведет к полной потере языковых способностей! Новейшие исследования Лаборатории обработки естественного языка Фуданьского университета.

14. Методология из исследования «Как на способности в больших языковых моделях влияет контролируемая точная настройка композиции данных»

Методология 17~25 взята из LLM Optimization: интерпретация китайской версии послойной оптимальной ранговой адаптации (LORA).

?Модель с открытым исходным кодом

этап	Знакомство с весами	Скачать адрес	Функции	базовая модель	метод тонкой настройки	Набор данных
?Наблюдение и тонкая настройка	Данные многоходового диалога обучаются на основе LLaMA2-7b-Chat.	CareLlama2-7b-chat-sft-multi、?CareLlama2-7b-multi	Отличные навыки многооборотной беседы	LLaMA2-7b-Чат	QLoRA	мм
Контролировать тонкую настройку	Богатые и эффективные данные диалога врача и пациента обучаются на основе LLaMA2-7b-Chat.	CareLlama2-7b-chat-sft-med	Отличные возможности диагностики заболеваний пациентов	LLaMA2-7b-Чат	QLoRA	хм
контролировать

Расширять