CareGPT Download – Download CareGPT Quellcodes

CareGPT

AI-Quellcode

1.0.0

Herunterladen

Chinesisch |. Englisch

Video-Tutorial Installation und Bereitstellung Online-Erlebnis

⚡Eigenschaften:

ChatGPT-Feinabstimmungsimplementierung hinzugefügt und Freunden mit Credits empfohlen, Feinabstimmungsexperimente an ChatGPT durchzuführen;
Unterstützt das Feinabstimmungsmodell für die ChatGPT-Next-Web-Bereitstellung;
Unterstützt Gradio-Bereitstellungs-Feinabstimmungsmodelle;
Unterstützt das LLaMA- und LLaMA-2-Vollserien-Modelltraining;
Unterstützt LoRA und QLoRA, einschließlich anschließender PPO- und DPO-Verstärkungslernschulungen;
Unterstützt Fragen und Antworten in Kombination mit Modellen und Wissensdatenbank;
Open-Source-Informationen zu medizinischem Beratungsmaterial für mehr als 60 Krankenhausabteilungen;
Entwicklung eines Tools zur Unterstützung der GPT-4/ChatGPT-Modelldestillation medizinischer Daten, mit dem verschiedene Daten zum Aufbau einer Wissensbasis und zur Feinabstimmung stapelweise generiert werden können;
Es bündelt eine Fülle von Open-Source-Medizin-LLM, medizinischen Daten für die LLM-Ausbildung, LLM-Bereitstellungsdaten, LLM-Bewertung und zugehörigen LLM-Ressourcensammlungen;
Wir haben an der CMB-Listenbewertung medizinischer LLMs teilgenommen – IvyGPT. Im Test lagen wir vor ChatGPT und einer Reihe von Open-Source-LLMs im medizinischen Bereich.
Wir verfügen über Open-Source-Lösungen für mehrere medizinische LLMs, die auf verschiedenen Basis-LLMs basierend auf unseren eigenen Datensätzen trainiert wurden. Sie können sie direkt herunterladen, um sie zu testen.

?Datensatz

Daten vor dem Training

LLM-Pretrain-FineTune/data_pretrain
MedicalGPT/Vorschulung
zyj
TCM-Ancient-Books (fast 700 alte chinesische Medizintexte)
epfl-llm/richtlinien

Überwachte Trainingsdaten

icliniq-10k(de)
HealthCareMagic-100k(en)
ShenNong_TCM_Dataset
✅ChatMed_Consult_Dataset
Daten zum chinesischen medizinischen Dialog
cMedQA2
✅Huatuo-26M
cMedQA2
webMedQA
PubMedQA
CMCQA
✅QiZhenGPT
✅LLM-Pretrain-FineTune/data_sft
Medizinisches Dialogsystem
IMCS-V2
CHIP-MDCFNPC
MedDG
✅HuatuoGPT-sft-data-v1
MedicalGPT/Feinabstimmung
✅hibing624/medizinisch
medAlpaca/Daten
✅Zhongjing/sft
medizinischer_dialog
huatuo_encyclopedia_qa
Med-ChatGLM/Daten
CMB
GenMedGPT-5k(en)
Alpaka-CoT(allgemein)
✅DISC-Med-SFT
✅HuatuoGPT2_sft_instruct
FreedomIntelligence/Medbase_data
openmedlab/Awesome-Medical-Dataset

Belohnungstrainingsdaten

MedicalGPT/Belohnung
Zhongjing/rw
vergleichen_gpt4_data
HH-RLHF
UltraFeedback

?️Vollständige Prozessschulung

1. Abhängigkeiten installieren

 conda create - n llm python = 3.11
conda activate llm
python - m pip install - r requirements . txt

Download des LLaMA-Modells: https://blog.csdn.net/u014297502/article/details/129829677

 # 转为HF格式
python - m transformers . models . llama . convert_llama_weights_to_hf 
    - - input_dir path_to_llama_weights - - model_size 7 B - - output_dir path_to_llama_model

Download des LLaMA-2-Modells: https://huggingface.co/meta-llama

2.Datenkonfiguration

Datensatzkonfiguration, PT-, SFT-, RW-Datenformat

dataset_info

Wenn Sie einen benutzerdefinierten Datensatz verwenden, stellen Sie sicher, dass Sie Ihre Datensatzdefinition in der Datei dataset_info.json im folgenden Format bereitstellen.

 "数据集名称" : {
  "hf_hub_url" : " HuggingFace上的项目地址（若指定，则忽略下列三个参数） " ,
  "script_url" : "包含数据加载脚本的本地文件夹名称（若指定，则忽略下列两个参数） " ,
  "file_name" : "该目录下数据集文件的名称（若上述参数未指定，则此项必需） " ,
  "file_sha1" : "数据集文件的SHA-1哈希值（可选） " ,
  "columns" : {
    "prompt" : "数据集代表提示词的表头名称（默认：instruction） " ,
    "query" : "数据集代表请求的表头名称（默认：input） " ,
    "response" : "数据集代表回答的表头名称（默认：output） " ,
    "history" : "数据集代表历史对话的表头名称（默认：None） "
  }
}

Die prompt und response sollten nicht leere Zeichenfolgen sein. Der Inhalt der query wird mit der prompt als Modelleingabe verkettet. Die history sollte eine Liste sein, in der jedes Element ein String-Tupel ist, das die Benutzeranfrage bzw. die Modellantwort darstellt.

PT-Beispieldaten

.txt Format, ein unbeaufsichtigter Datenwert pro Zeile.

Machine learning (ML) is a field devoted to understanding and building methods that let machines "learn" – that is, methods that leverage data to improve computer performance on some set of tasks.
Machine learning algorithms build a model based on sample data, known as training data, in order to make predictions or decisions without being explicitly programmed to do so. Machine learning algorithms are used in a wide variety of applications, such as in medicine, email filtering, speech recognition, agriculture, and computer vision, where it is difficult or unfeasible to develop conventional algorithms to perform the needed tasks.

SFT-Beispieldaten 1

[
  {
    "instruction" : "听起来很不错。人工智能可能在哪些方面面临挑战呢？ " ,
    "input" : " " ,
    "output" : "人工智能面临的挑战包括数据隐私、安全和道德方面的问题，以及影响就业机会的自动化等问题。 " ,
    "history" : [
      [ "你好，你能帮我解答一个问题吗？ " , "当然，请问有什么问题？ " ],
      [ "我想了解人工智能的未来发展方向，你有什么想法吗？ " , "人工智能在未来的发展方向可能包括更强大的机器学习算法，更先进的自然语言处理技术，以及更加智能的机器人。 " ]
    ]
  }
]

SFT-Beispieldaten 2

[
  {
    "instruction" : "听起来很不错。人工智能可能在哪些方面面临挑战呢？ " ,
    "input" : " " ,
    "output" : "人工智能面临的挑战包括数据隐私、安全和道德方面的问题，以及影响就业机会的自动化等问题。 " ,
    "history" : []
  }
]

RW-Beispieldaten

[
  {
    "instruction" : "生成三个与“道歉”意思相同的动词" ,
    "input" : " " ,
    "output" : [
      "承认，表示遗憾，弥补。 " ,
      "道歉"
    ]
  }
]

3. Trainingskonfiguration

Trainingsparameter und Anweisungen

Verteilt konfigurieren

Überprüfen Sie, ob Ihre Grafikkarte mit NVLINK verbunden ist. Nur mit einer NVLINK-Verbindung können Sie accelerate effektiv für parallel beschleunigtes Training nutzen.

 nvidia-smi topo -m

 accelerate config # configure the environment
accelerate launch src / train_bash . py # arguments (same as above)

Betreutes Training

 # LLaMA-2
accelerate launch src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_train 
    - - dataset mm 
    - - finetuning_type lora 
    - - quantization_bit 4 
    - - overwrite_cache 
    - - output_dir output 
    - - per_device_train_batch_size 8 
    - - gradient_accumulation_steps 4 
    - - lr_scheduler_type cosine 
    - - logging_steps 10 
    - - save_steps 1000 
    - - learning_rate 5e-5 
    - - num_train_epochs 2.0 
    - - plot_loss 
    - - fp16 
    - - template llama2 
    - - lora_target q_proj , v_proj

# LLaMA
accelerate launch src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - do_train 
    - - dataset mm , hm 
    - - finetuning_type lora 
    - - overwrite_cache 
    - - output_dir output - 1 
    - - per_device_train_batch_size 4 
    - - gradient_accumulation_steps 4 
    - - lr_scheduler_type cosine 
    - - logging_steps 10 
    - - save_steps 2000 
    - - learning_rate 5e-5 
    - - num_train_epochs 2.0 
    - - plot_loss 
    - - fp16 
    - - template default 
    - - lora_target q_proj , v_proj

Verstärkungslernen

 # LLaMA-2, DPO
accelerate launch src / train_bash . py 
    - - stage dpo 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_train 
    - - dataset rlhf 
    - - template llama2 
    - - finetuning_type lora 
    - - quantization_bit 4 
    - - lora_target q_proj , v_proj 
    - - resume_lora_training False 
    - - checkpoint_dir . / output - 2 
    - - output_dir output - dpo 
    - - per_device_train_batch_size 2 
    - - gradient_accumulation_steps 4 
    - - lr_scheduler_type cosine 
    - - logging_steps 10 
    - - save_steps 1000 
    - - learning_rate 1e-5 
    - - num_train_epochs 1.0 
    - - plot_loss 
    - - fp16

4. Inferenzkonfiguration

Inferenzparameter und Anweisungen

Webzugriff

 # LLaMA-2
python src / web_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / web_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

# DPO
python src / web_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output - dpo 
    - - finetuning_type lora 
    - - template llama2

API-Zugriff

 # LLaMA-2
python src / api_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / api_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

# DPO
python src / api_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output - dpo 
    - - finetuning_type lora 
    - - template llama2

Test-API:

 curl - X 'POST' 
    'http://127.0.0.1:8888/v1/chat/completions' 
    - H 'accept: application/json' 
    - H 'Content-Type: application/json' 
    - d ' {
    "model" : "string",
    "messages": [
      {
        "role" : "user",
        "content": "你好"
      }
    ],
    " temperature ": 0 ,
    "top_p" : 0 ,
    "max_new_tokens" : 0 ,
    "stream" : false
  }'

CLI-Zugriff

 # LLaMA-2
python src / cli_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / cli_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

# DPO
python src / cli_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output - dpo 
    - - finetuning_type lora 
    - - template llama2

Batch-Vorhersage

 # LLaMA-2
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_predict 
    - - dataset mm 
    - - template llama2 
    - - finetuning_type lora 
    - - checkpoint_dir output 
    - - output_dir predict_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

# LLaMA
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - do_predict 
    - - dataset mm 
    - - template default 
    - - finetuning_type lora 
    - - checkpoint_dir output - 1 
    - - output_dir predict_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

Experimentelle Auswertung (BLEU und ROUGE_CHINESE)

 # LLaMA-2
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - do_eval 
    - - dataset mm 
    - - template llama2 
    - - finetuning_type lora 
    - - checkpoint_dir output 
    - - output_dir eval_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

# LLaMA
CUDA_VISIBLE_DEVICES = 0 python src / train_bash . py 
    - - stage sft 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - do_eval 
    - - dataset mm 
    - - template default 
    - - finetuning_type lora 
    - - checkpoint_dir output - 1 
    - - output_dir eval_output 
    - - per_device_eval_batch_size 8 
    - - max_samples 100 
    - - predict_with_generate

Für die 4/8-Bit-Auswertung wird die Verwendung --per_device_eval_batch_size=1 und --max_target_length 128 empfohlen

5. Gradieller Einsatz

Anweisungen zur Gradio-Bereitstellung

Modellexport

 # LLaMA-2
python src / export_model . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - template llama2 
    - - finetuning_type lora 
    - - checkpoint_dir output - 1 
    - - output_dir output_export

# LLaMA
python src / export_model . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - template default 
    - - finetuning_type lora 
    - - checkpoint_dir output 
    - - output_dir output_export

Fangen Sie an zu laufen

 % cd Gradio
python app . py

6.ChatGPT-Next-Web-Bereitstellung

Nächste Bereitstellungsanweisungen

API-Dienst starten

 # LLaMA-2
python src / api_demo . py 
    - - model_name_or_path . / Llama - 2 - 7 b - chat - hf 
    - - checkpoint_dir output 
    - - finetuning_type lora 
    - - template llama2

# LLaMA
python src / api_demo . py 
    - - model_name_or_path . / Llama - 7 b - hf 
    - - checkpoint_dir output - 1 
    - - finetuning_type lora 
    - - template default

Laden Sie Next herunter und führen Sie es aus

HerunterladenWeiter:

Konfiguration ändern: Installieren und öffnen Sie „Weiter“, öffnen Sie dann设置, ändern Sie接口地址in: http://127.0.0.1:8000/ (d. h. Ihre API-Schnittstellenadresse), und dann können Sie sie verwenden.

?Praxiserfahrung

In CareGPT wird die chinesische Wortsegmentierung nicht zum Wortsegmentierungsmodell hinzugefügt und neu trainiert, aber der Effekt ist immer noch vielversprechend;
Der gesamte Prozess des LLM-Trainings umfasst: Vorschulung, überwachte Feinabstimmung, Belohnungsmodell und verstärkendes Lernen. In den meisten Fällen kann die überwachte Feinabstimmung Ihre eigenen Bedürfnisse erfüllen .
Wenn die Rechenleistung ausreicht, wird empfohlen , für das Training medizinische Daten und allgemeine Korpusdaten zu verwenden , damit das Modell nicht nur medizinisches Training und Lernen absolvieren, sondern auch allgemeine Fähigkeiten beibehalten kann (z. B. das Befolgen von Anweisungen).
Erwarten Sie nicht, dass ein medizinisches LLM alle Anforderungen erfüllen kann. Ein vernünftiger Ansatz kann eine in Echtzeit aktualisierte Wissensdatenbank + ein fein abgestimmtes medizinisches LLM sein (wie ChatLaw).
Die BLOOMZ-Modellreihe wurde mit dem PILE-Korpus trainiert, der verschiedene medizinische Texte enthält, darunter PubMed Central und PubMed Abstracts . Diese wertvollen Texte haben das medizinische Wissenssystem des BLOOMZ-Modells erheblich bereichert, sodass viele Open-Source-Projekte BLOOMZ als Basismodell für die medizinische Feinabstimmung Vorrang einräumen werden;
(26.08.2023) ChatGPT wird auf der Grundlage von Code GPT trainiert. Werden wir CodeLLaMA zur Feinabstimmung nachgelagerter Aufgaben verwenden, um bessere Ergebnisse zu erzielen als die Feinabstimmung auf LLaMA-1/2?
Die Kombination unserer jüngsten Arbeiten mit vielen kürzlich veröffentlichten Arbeiten beweist: In der LLM-Ära ist质量> 数量die Wahrheit, wie zum Beispiel: Übergeben an Qingyuan&& Caspian | Verwenden Sie 200 Daten zur Feinabstimmung des Modells MiniGPT-4 ! , extrem große SFT-Daten werden das nachgelagerte Aufgaben-LLM schwächen oder ICL, CoT und andere Fähigkeiten verlieren;
Bei vertikalen Modellen sollten wir dem PT-Prozess möglicherweise mehr Aufmerksamkeit schenken, anstatt zig Millionen SFT-Daten für das Training zu sammeln. Unser Vorschlag ist大规模预训练+小规模监督微调=超强的LLM模型.
Ein guter vorab ausgebildeter medizinischer LLM wurde in der Open-Source-Community noch nicht geöffnet, und ich hoffe, dass jemand diese Arbeit ergänzen kann;
Vorschulung kann Wissen vermitteln, während überwachte Feinabstimmung nur Domänenfähigkeiten aktiviert (kann sich nicht auf Wissen konzentrieren)? Sollte das Vorschulungswissen das überwachte Feinabstimmungswissen widerspiegeln? Werden die Dutzende GB an vorab trainiertem Korpuswissen durch das ursprüngliche vorab trainierte Modellwissen von Billionen von Token überwältigt?
Das sekundäre Vortraining einer großen Datenmenge erfordert den Abgleich verschiedener Arten anderer Daten: (1) Nach Abschluss des Sprachmodelltrainings wurden die verantwortlichen Teile jedes Bereichs mit großen Wissensmengen bestimmt Das Hinzufügen von Parametern, die während des Vortrainings nicht verfügbar sind, führt zu einem Verlust der gesamten Fähigkeit des Sprachmodells Vortraining muss hinzugefügt, gemischt und gemeinsam trainiert werden.
In der Phase der Feinabstimmung der Anweisungen können nicht zu viele Trainingsrunden durchgeführt werden: (1) Das Training mehrerer EPOCHs mit einer kleinen Datenmenge kann zu Änderungen in Schlüsselbereichen der Sprache führen, was zum Scheitern des gesamten Modells führt -Optimierung für spezifische Aufgabenverbesserungen. Um sicherzustellen, dass die Schlüsselbereiche der Sprachfähigkeiten des Modells nicht wesentlich angepasst werden, ist es notwendig, allgemeine Anweisungen zur Feinabstimmung von Daten oder Daten vor dem Training hinzuzufügen.
Trainingsdaten müssen das Rauschen streng kontrollieren: (1) Wenn die Daten vor dem Training eine kleine Menge kontinuierlicher Rauschdaten enthalten, z. B. kontinuierliche Wiederholungen von Wörtern, Nicht-Wort-Sequenzen usw., kann dies zu Anpassungen in bestimmten Dimensionen führen. Dies führt dazu, dass die Gesamt-PPL des Modells erheblich schwankt. (2) Wenn die überwachten Feinabstimmungsanweisungen eine große Anzahl von Befehlsfragmenten enthalten, die nicht mit dem ursprünglichen großen Sprachmodell übereinstimmen, kann dies auch dazu führen, dass das Modell bestimmte Dimensionen anpasst , wodurch die Gesamtleistung des Modells erheblich verringert wird;
Bei der Feinabstimmung eines großen Modells mit gemischten Daten mit mehreren Funktionen wird Folgendes angezeigt: hoher Ressourcenkonflikt und geringer Ressourcengewinn, sodass das Mischen verschiedener Daten zur Feinabstimmung bestimmte technische Fähigkeiten erfordert;
Im Allgemeinen gibt es einen nicht zu vernachlässigenden Leistungsunterschied zwischen Lora und vollständiger Feinabstimmung (z. B. führt LoRA zu einer um 4–6 % geringeren Leistung im Vergleich zur vollständigen Feinabstimmung);
Bitte geben Sie der vollständigen Parameter-Feinabstimmungsmethode für Modelle der 7B-Serie Vorrang. Für Modelle der 13B-Serie und höher können andere Methoden verwendet werden.
Selbst wenn ein Modell mit sehr großen Parametern quantifiziert wird, können seine Fähigkeiten dennoch gut aufrechterhalten werden;
Obwohl das LLM-Training (oder alle auf der GPU trainierten Modelle) unvermeidlich Zufälligkeit aufweist, sind die Ergebnisse des Multi-LUN-Trainings immer noch sehr konsistent.
Wenn Ihr GPU-Speicher begrenzt ist, bietet QLoRA einen kostengünstigen Kompromiss. Es spart 33 % Speicher auf Kosten einer 39 % längeren Laufzeit;
Bei der Feinabstimmung von LLM ist die Wahl des Optimierers nicht der Hauptfaktor, der die Ergebnisse beeinflusst. Ob AdamW, SGD mit Scheduler oder AdamW mit Scheduler, die Auswirkung auf die Ergebnisse ist minimal;
Obwohl Adam oft als speicherintensiver Optimierer angesehen wird, da er für jeden Modellparameter zwei neue Parameter einführt, hat dies keinen wesentlichen Einfluss auf den Spitzenspeicherbedarf von LLM. Dies liegt daran, dass der größte Teil des Speichers für die Multiplikation großer Matrizen reserviert wird und nicht für die Speicherung zusätzlicher Parameter.
Bei statischen Datensätzen funktionieren mehrere Iterationen wie mehrere Trainingsrunden möglicherweise nicht gut. Dies führt oft zu einer Überanpassung und einer Verschlechterung der Trainingsergebnisse;
Wenn Sie LoRA kombinieren möchten, stellen Sie sicher, dass es auf allen Ebenen angewendet wird, nicht nur auf der Schlüssel- und Wertmatrix, um die Leistung des Modells zu maximieren.
Es ist wichtig, den LoRA-Rang anzupassen und einen geeigneten α-Wert zu wählen. Um einen kleinen Trick zu bieten, versuchen Sie, den α-Wert auf das Doppelte des Rangwerts festzulegen.
Eine einzelne GPU mit 14 GB RAM kann ein großes Modell mit 7 Milliarden Parametern in wenigen Stunden effizient optimieren. Bei statischen Datensätzen ist es unmöglich, LLM zu einem „Allrounder“ zu machen und bei allen Basisaufgaben gute Leistungen zu erbringen. Die Lösung dieses Problems erfordert diversifizierte Datenquellen oder den Einsatz anderer Technologien als LoRA;
Gemäß den Empfehlungen des NeurIPS-Workshops mit Stand vom 18. Dezember 2023英文10B以下选择Mistral-7B中文, 10B以下选择Yi-6B 10B und 10B以上选择Qwen-14B和Yi-34B ;

Wichtig

Jeder ist herzlich willkommen, neue Erfahrungen zu ISSUE hinzuzufügen!

11~13 Die Methodik stammt aus 13 Milliarden großen Sprachmodellen. Wenn Sie nur ein Gewicht ändern, geht die Sprachfähigkeit vollständig verloren! Die neuesten Forschungsergebnisse des Natural Language Processing Laboratory der Fudan-Universität.

14Methodik zur Frage, wie Fähigkeiten in großen Sprachmodellen durch überwachte Feinabstimmung der Datenzusammensetzung beeinflusst werden

Die Methodik 17~25 stammt aus der Interpretation der chinesischen Version von LLM Optimization: Layer-wise Optimal Rank Adaptation (LORA).

?Modell Open Source

Bühne	Einführung in Gewichte	Adresse herunterladen	Merkmale	Basismodell	Feinabstimmungsmethode	Datensatz
?Überwachung und Feinabstimmung	Multiturn-Dialogdaten werden basierend auf LLaMA2-7b-Chat trainiert	CareLlama2-7b-chat-sft-multi、?CareLlama2-7b-multi	Hervorragende Konversationsfähigkeiten in mehreren Runden	LLaMA2-7b-Chat	QLoRA	mm
Überwachen Sie die Feinabstimmung	Umfangreiche und effiziente Daten zum Arzt-Patient-Dialog werden auf Basis von LLaMA2-7b-Chat trainiert	CareLlama2-7b-chat-sft-med	Hervorragende Möglichkeiten zur Diagnose von Patientenkrankheiten	LLaMA2-7b-Chat	QLoRA	Hm
überwachen

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ AI-Quellcode
Aktualisierungszeit 2024-12-09
Größe 22.13MB
Kommt von Github

Ähnliche Anwendungen

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14