QiZhenGPT: オープンソースの中国語医療大規模言語モデル
このプロジェクトでは、Qizhen Medical Knowledge Base によって構築された中国の医療指導データセットを使用しており、これに基づいて指示が Chinese-LLaMA-Plus-7B、CaMA-13B、および ChatGLM-6B モデルで微調整され、大幅に改善されています。中国の医療シナリオにおけるモデルのパフォーマンス 望ましい結果を達成するために、まず医薬品知識 Q&A の評価データセットをリリースし、その後、病気、手術、検査などに対する Q&A の効果を最適化し、次のようなアプリケーションに拡張する予定です。医師と患者の Q&A および医療記録の自動生成。
MedCopilot
は、启真医学大模型
、Qizhen の医療知識ベース、医疗临床数据
に基づいて開発されたスマート医療アシスタントであり、患者、医師、病院経営に包括的なスマート サポートを提供することを目的としています。高度な人工知能技術、豊富な医療知識、臨床データを統合することで、MedCopilot は医療業界の新たな生産力となります。
MedCopilot は浙江大学第二付属病院で正式に開始されました。
[2024/08/09] MedCopilot 関連情報を更新しました。
[2023/06/27] オープンソースの QiZhen 医療大型モデル試用版 (QiZhen-CaMA-13B-Checkpoint-12400) は、医療分野における病気や薬剤に関する知識 Q&A の精度向上を目的としています。
[2023/06/09] オープンソースの QiZhen 医療大型モデル試用版 (QiZhen-CaMA-13B-Checkpoint-6000) は、医療分野における医薬品知識の質問と回答の精度を向上させるように設計されています。
[2023/06/02] オープンソースの QiZhen 医療大型モデル試用版 (QiZhen-CaMA-13B-Checkpoint-3600) は、医療分野における医薬品知識 Q&A の精度を向上させるように設計されています。
[2023/05/30] オープンソースの 20,000 トレーニング データ (このデータセットは、祁鎮医学知識ベースによって収集および編集された実際の医師と患者の知識の質問と回答データから来ており、祁鎮医学知識ベースの医薬品テキスト知識に基づいており、セミ-構造化データは、特定の質問テンプレートによって構築された指示データを設定します)。
[2023/05/30] オープンソースの QiZhen 医療大型モデル試用版 (QiZhen-ChatGLM-6B-Checkpoint-2500) は、医療分野における医薬品知識の質問と回答の精度を向上させるように設計されています。
[2023/05/25] オープンソースの医薬品適応評価データセット;
[2023/05/24] オープンソースの QiZhen 医療大型モデル試用版 (QiZhen- Chinese-LLaMA-7B- Checkpoint-6000) は、医療分野における医薬品知識の質問と回答の精度を向上させるように設計されています。
[2023/05/23] オープンソースの QiZhen 医療大型モデル試用版 (QiZhen- Chinese-LLaMA-7B- Checkpoint-3500) は、医療分野における医薬品知識 Q&A の精度を向上させるように設計されています。
MedCopilot は HIS システムおよび電子医療記録システムと緊密に統合されており、Qizhen Medical の大型モデルを使用して各システムからのデータを分析し、その日の医師の重要な作業項目を自動的に要約します。
MedCopilot は、Qizhen の医療知識ベースと患者の臨床データを組み合わせて、個別化された診断と治療の推奨事項を提供し、医師がより正確な医療上の決定を行えるようにします。
国の医療の質に関する方針に従って、MedCopilot は医療プロセス データをリアルタイムで監視し、潜在的な問題を適時に検出して修正し、全体的な医療の質を向上させます。
MedCopilotは、患者の診断・治療データを総合的に分析し、法規制に準拠したカルテ文書を自動生成することで、医師の繰り返し作業を軽減し、業務効率を向上させます。
現在、ほとんどのオープンソース ChatLLM プロジェクトは、他のモデル (ChatGPT など) によって生成された命令データを使用しているため、必然的にデータ錯覚の問題が発生し、実際のシナリオでの LLM の適用と拡張に深刻な影響を及ぼします。そこで、本プロジェクトでは、医療分野における知識問答の精度を向上させるために、以下の手法を用いて指導データセットを構築する。
560K
の指示データとともに収集します。180K
命令データ。298K
命令データ。3500 steps
(トレーニング 23 時間 50 分)。6000 steps
(トレーニング 40 時間 56 分)。2500 steps
の LoRA 重みです。 (トレーニング 16 時間 20 分);3600 steps
の LoRA 重みです。 (トレーニング 37 時間 37 分)。6000 steps
の LoRA 重みです。 (トレーニング54時間30分)。12400 steps
の LoRA 重みです。 (トレーニング 114 時間 46 分)。モデル | 命令データセット | ベースモデル | LoRAのダウンロード |
---|---|---|---|
QiZhen-中国語-LLaMA-7B-チェックポイント-3500 | 740K | 中国語-LLaMA-Plus-7B | 百度スカイディスク |
QiZhen-中国語-LLaMA-7B-チェックポイント-6000 | 740K | 中国語-LLaMA-Plus-7B | 百度スカイディスク |
QiZhen-ChatGLM-6B-チェックポイント-2500 | 740K | チャットGLM-6B | 百度スカイディスク |
QiZhen-CaMA-13B-チェックポイント-3600 | 740K | CaMA | 百度スカイディスク |
QiZhen-CaMA-13B-チェックポイント-6000 | 740K | CaMA | 百度スカイディスク |
QiZhen-CaMA-13B-チェックポイント-12400 | 1038K | CaMA | 百度スカイディスク |
pip install -r requirements.txt
Chinese-LLaMA-Plus-7B を入手します。詳細については、ここを参照してください。
LoRA をダウンロードし、モデルをダウンロードして、lora ディレクトリに配置します。
scripts/merge_llama_plus.sh スクリプトを実行します。
sh scripts/merge_llama_plus.sh
gradio_chinese-llama_demo.py
のモデル位置パラメータを変更します。 python gradio_chinese-llama_demo.py
pip install -r requirements.txt
ChatGLM-6B を入手します。詳細については、ここを参照してください。
LoRA をダウンロードし、モデルをダウンロードして、lora ディレクトリに配置します。
gradio_chatglm_demo.py
のモデル位置パラメータを変更します。
デモを開始します。
python gradio_chatglm_demo.py
pip install -r requirements.txt
CaMA を入手します。詳細はこちら;
LoRA をダウンロードし、モデルをダウンロードして、lora ディレクトリに配置します。
gradio_cama_demo.py
のモデル位置パラメータを変更します。
デモを開始します。
python gradio_cama_demo.py
Qizhen Medical Large Model は、「データ + 知識の二輪駆動」の技術的ルートを堅持しており、大型モデル技術と医療知識ベースの緊密な統合を通じて、医療データ管理、医療推論に至るまでの医療アプリケーション シナリオの実際のニーズを統合します。 、医師と患者の Q&A 医療業界における大規模モデル技術の実装と応用を促進するために、医療記録の自動生成や臨床意思決定支援システムなどの分野で反復的な研究開発が行われます。下の写真は、「Qizhen Medical Knowledge Base が大規模モデルの回答生成を支援」の事例であり、この技術はテスト後にリリースされました。
入力: デカン酸フルフェナジン注射の適応症
ChatGLM: デカン酸フルフェナジン注射剤は、以下の適応症を持つ薬剤です: 1. うつ病、不安、不眠症などの精神神経症状の治療に使用されます。 2. てんかん、脳外傷、脳動脈硬化症およびその他の神経疾患の治療に使用されます。月経困難症、関節炎、その他の痛みを伴う疾患などの慢性的な痛みを軽減します。 4. 学習能力と記憶能力を向上させるために使用され、子供や青少年の知的発達と学習効果の向上に使用できます。エイズ感染症と治療法。 デカン酸フルフェナジン注射は、うつ病、不安、不眠症の治療に一般的に使用される経口薬です。医師のアドバイスに基づいて治療計画を立てる必要があります。デカン酸フルフェナジン注射液を使用する場合は、医師のアドバイス、および薬の説明書に記載されている投薬指示および用量に従う必要があります。
ChatGPT: フルマゼニル デカン酸注射液 (フルマゼニル注射液) は、ベンゾジアゼピン系薬剤 (ジアゼパム薬など) の過剰摂取または過剰使用によって引き起こされる鎮静状態または催眠状態の治療に使用される薬です。ベンゾジアゼピン受容体拮抗薬として作用し、ベンゾジアゼピンの中枢神経系抑制作用を逆転させることができます。 <デカン酸フルフェナジン注射液は主に以下の適応症に使用されます。
1. ベンゾジアゼピンの過剰摂取:ジアゼパム薬の過剰摂取または過剰使用により、患者が昏睡、眠気、呼吸抑制などの症状を経験した場合、デカン酸フルフェナジン注射を使用してこれらの症状を逆転させることができます。
2. 麻酔中の逆転: デカン酸フルフェナジン注射は、手術またはその他の麻酔処置後のベンゾジアゼピンの鎮静効果を逆転させ、患者が意識状態に戻るのを助けるために使用できます。
3. 診断用途: デカン酸フルフェナジン注射液は、ベンゾジアゼピン中毒または過剰摂取の診断を補助するために使用することもできます。
デカン酸フルフェナジン注射は合理的に使用し、特定の状況に基づいて専門の医師によって監視される必要があることに注意してください。この薬を使用する前に、薬の説明書をよく読んで従い、医師の指示と推奨に従ってください。
QiZhen- Chinese-LLaMA-7B- Checkpoint-3500: この製品は、統合失調症、躁病などに使用されます。 筋強直性疼痛にも使用できます。
QiZhen-CaMA-13B-Checkpoint-3600: この製品は、統合失調症のさまざまな症状に使用されます。
input: チベットグリーンフルーツティーの主な機能は何ですか?
ChatGLM: チベットグリーンフルーツティーは、主に緑色の果物、茶葉、蜂蜜などから作られた自然飲料です。その主な機能は次のとおりです。 1. 免疫力の向上:チベットグリーンフルーツティーにはビタミンC、ビタミンEなどの栄養素が豊富に含まれており、体の免疫力を高め、体の抵抗力を向上させ、病気の発生を防ぐことができます。 2. 消化を促進する:チベットのグリーンフルーツティーには繊維が豊富に含まれており、胃腸の運動を促進し、消化を助け、便秘を防ぐことができます。 3. 抗酸化作用:チベットグリーンフルーツティーに含まれるグリーンフルーツエキスには強力な抗酸化作用があり、体内のフリーラジカルを除去し、老化を遅らせ、病気を予防します。 4. 血中脂質を下げる:チベットグリーンフルーツティーに含まれる茶抽出物には、血中脂質を低下させる一定の効果があり、高脂血症の予防と治療に役立ちます。 5. 睡眠の改善:チベットグリーンフルーツティーに含まれる蜂蜜には一定の鎮静効果があり、ストレスを緩和し、睡眠の質を向上させ、体の自己治癒能力を向上させることができます。
ChatGPT: チベットグリーンフルーツティーは、チベットグリーンフルーツを主原料として作られたお茶飲料です。私の知る限り、次の主な機能があります。
1. 抗酸化作用:チベットの緑色の果実には、ポリフェノールやビタミンCなどのさまざまな天然の抗酸化物質が豊富に含まれており、体内のフリーラジカルを除去し、細胞の老化を遅らせ、免疫力を高めるのに役立ちます。
2. 消化を促進:チベットグリーンフルーツティーには優れた消化促進効果があり、胃腸の運動性を促進し、消化機能を改善し、胃の不快感や消化不良を和らげます。
3. 栄養を与える:チベットグリーンフルーツにはビタミンC、ビタミンE、ビタミンB複合体、ミネラル、その他の栄養素が豊富に含まれており、チベットグリーンフルーツティーを飲むことで体に必要な栄養素を補給できます。
4. 減量:チベットグリーンフルーツティーには減量効果があると考えられており、新陳代謝を促進し、脂肪の分解と燃焼を促進し、体重と脂肪の蓄積を軽減します。
5. 抗炎症作用と鎮痛作用:チベットグリーンフルーツティーには抗炎症作用と鎮痛作用のある成分が含まれており、関節痛、筋肉痛、頭痛などの不快感を和らげることができます。
6. 睡眠の改善:チベットのグリーンフルーツティーは神経系をリラックスさせ、心を落ち着かせて落ち着かせる効果があり、睡眠の質を向上させ、不眠症の問題を軽減します。
上記の効果は主にチベットグリーンフルーツティーの伝統的な使用法と特定の研究結果に基づいているため、具体的な効果は個人差や使用方法によって影響を受ける可能性があることに注意してください。特定の健康状態がある場合、または薬の服用が必要な場合は、医師または医療専門家にアドバイスを求めることをお勧めします。
QiZhen- Chinese-LLaMA-7B- Checkpoint-3500: 熱を取り除き、解毒し、体液を生成し、喉の渇きを癒します。 発熱、喉の渇き、喉の痛みなどの症状を和らげる効果があります。
QiZhen-CaMA-13B-Checkpoint-3600: 隠れた青いフルーツティーには、熱を取り除き、喉を落ち着かせ、腫れを軽減し、痛みを和らげる効果があります。
チベットグリーンフルーツティーは、喉の発赤や痛み、喉の乾燥や灼熱感、声がれなどの症状を和らげるのに使用できます。
input: ライター症候群の臨床症状は何ですか?
ChatGLM: ライター症候群 (ライター症候群 I 型) は、次のような臨床症状を示す先天性心雑音です。
心雑音:ライト症候群 I 型の特徴的な心雑音は、卵円孔開存によって引き起こされる右から左へのシャント雑音であり、通常、雑音の強度、位置、および周波数の変動を特徴とします。
肺高血圧症: ライター症候群 I 型の人は肺高血圧症になることが多く、呼吸不全や心不全を引き起こす可能性があります。
成長および発達の異常: ライター症候群 I 型の人のほとんどは、小児期および青年期に低身長、栄養失調、巨人症などの成長および発達の異常を示します。
心臓の構造異常: 雑音はライター症候群 I 型の主な臨床症状ですが、一部の患者は心臓弁膜症や不整脈などの心臓の他の構造異常を患っている場合もあります。
その他の症状: ライター症候群 I 型の人には、疲労、呼吸困難、胸痛、咳、膨満感、便秘などの他の症状が見られる場合もあります。これらの症状は心雑音や肺高血圧症に関連している可能性がありますが、他の要因にも関連している可能性があります。
なお、ライター症候群Ⅰ型は稀な疾患であり、臨床症状は個人差により異なります。ライター症候群 I 型の疑いがある場合は、診断と治療のために直ちに医師の診察を受けてください。
ChatGPT: ライター症候群とは、下部食道括約筋のアカラシアと胃食道逆流症(GERD)による食道の運動性の低下によって引き起こされる疾患を指します。その主な臨床症状には次のものがあります。
嚥下障害: 患者は飲み込むときに引っかかりを感じ、食べ物を飲み込むために数回飲み込む必要があります。
胸痛: ライター症候群の人は、特に食事後や横になった後に胸痛を経験することがよくあります。
げっぷと胃酸逆流: 患者は、特に食事後や横になった後に、げっぷや胃酸逆流を経験することがよくあります。
嗄れ声:逆流物質による口や喉の領域の刺激により、患者の声がかすれることがあります。
喉の痛み:逆流物質が喉の粘膜を刺激します。
ライター症候群の症状は他の病気の症状と似ているため、診断は関連する検査や診断方法によって確定する必要があることに注意することが重要です。
QiZhen-CaMA-13B-Checkpoint-12400: ライター症候群の主な臨床症状は、急性または慢性の関節炎、尿道炎、結膜炎、皮膚および粘膜の病変です。
ライター症候群は、原因不明の慢性非特異的炎症性疾患であり、尿道の炎症、結膜炎、皮膚、粘膜を伴う場合がある、再発性の移動性の非対称性脊椎関節炎を特徴とします。そして目の病変。
ライター症候群の主な臨床症状は、急性または慢性の関節炎、尿道炎、結膜炎、皮膚および粘膜の病変です。
1. 関節炎:最も一般的であり、あらゆる関節が影響を受ける可能性があり、膝、足首、足の小さな関節でより一般的であり、局所的な発赤、腫れ、熱、痛み、機能不全が発生することがあります。
2. 尿道炎:頻尿、尿意切迫感、排尿困難、尿道口の発赤や腫れ、尿道分泌物の増加などの症状が現れます。
3. 結膜炎:片側または両側の結膜炎症として現れ、結膜充血、浮腫、眼瞼浮腫、分泌物の増加などが含まれる場合があります。
4. 皮膚および粘膜の病変:脂漏性紅斑、性器紅斑、膿疱、皮膚膿疱、皮膚潰瘍として現れます。
評価基準: 94
種類の医薬品データをランダムに選択し、「{drug} の適応症」の構成指示に従い、ChatGPT (gpt3.5)、ChatGLM、QiZhe にそれぞれ回答させ、専門の医療関係者に模型的答案
てもらいます。および该药品的药品说明书
によるスコアは次の 3 つのスコア基準です。
基準 1: 模範解答が 1 つの指標に当てはまれば正解です。
基準 2: 模範解答でヒットした適応症の数が、医薬品添付文書の適応症の数の 1/2 以上であれば、正解です。
基準 3: 模範解答でヒットした適応症の数が医薬品添付文書の適応症の数の 2/3 以上であれば、正解です。
モデル | 標準1 | スタンダード2 | スタンダード3 |
---|---|---|---|
チャットGLM | 39.36% | 23.16% | 14.74% |
チャットGPT | 47.87% | 30.85% | 15.96% |
QiZhen-中国語-LLaMA-7B-チェックポイント-3500 | 77.66% | 55.32% | 40.00% |
QiZhen-中国語-LLaMA-7B-チェックポイント-6000 | 90.43% | 73.40% | 65.96% |
QiZhen-CaMA-13B-チェックポイント-3600 | 82.29% | 60.62% | 47.92% |
QiZhen-CaMA-13B-チェックポイント-6000 | 90.43% | 80.85% | 72.34% |
QiZhen-CaMA-13B-チェックポイント-12400 | 91.49% | 82.98% | 72.34% |
述べる:
repetition_penalty
パラメーターを増やしてください。QiZhen-CaMA-13B-Checkpoint-3600
と比較して、LoRA のパラメーター量が増加し、効果が効果的に向上しました。評価基準:ランダムに100
疾患データを選択し、「{病気}に効く薬はどれか?」「{病気}にはどんな検査が必要か?」「{病気}の臨床症状は何か?」から「治療薬」を生成?」、「検査」および「臨床症状」は以下を指します。注文して、ChatGPT (gpt3.5)、ChatGLM、QiZhen0 にそれぞれ回答させ、専門の医療従事者に模型的答案
启真医学知识库疾病知识
と比較して採点してもらいます。 3 つの採点基準は次のとおりです。 :
基準1:模範解答が「治療薬」(「検査試験」、「臨床症状」)に当てはまれば正解、「治療薬」に当てはまれば正解。
基準2:模範解答でヒットした「治療薬」(「検査検査」「臨床症状」)の数が、薬剤説明書の適応数の1/2以上であれば正解;
基準3:模範解答でヒットした「治療薬」(「検査検査」「臨床症状」)の数が、薬剤説明書の適応数の2/3以上であれば正解;
モデル | 臨床成績基準 1 | 臨床成績基準 2 | 臨床成績基準 3 | 検査基準1の確認 | 検査基準2の確認 | 検査基準3の確認 | 治療薬基準1 | 治療薬基準2 | 治療薬基準 3 |
---|---|---|---|---|---|---|---|---|---|
チャットグラム | 90.00% | 6.00% | 3.00% | 93.00% | 11.00% | 6.00% | 60.00% | 10.00% | 5.00% |
チャットチャット | 94.00% | 11.00% | 4.00% | 97.00% | 8.00% | 5.00% | 62.00% | 11.00% | 4.00% |
QiZhen-CaMA-13B-チェックポイント-12400 | 95.00% | 15.00% | 7.00% | 97.00% | 20.00% | 7.00% | 75.00% | 36.00% | 23.00% |
また、本プロジェクトは以下のオープンソースプロジェクトの二次開発をベースとしておりますので、関係プロジェクトおよび研究開発関係者の皆様に心より感謝申し上げます。
詳細についてはライセンスを参照してください
このプロジェクトに関連するリソースは学術研究のみを目的としており、商用利用は固く禁じられています。サードパーティのコードが含まれる部分を使用する場合は、対応するオープンソース契約に厳密に従ってください。モデルによって生成されるコンテンツは、モデルの計算、ランダム性、定量化精度の損失などの要因の影響を受けるため、本プロジェクトはその精度を保証するものではありません。このプロジェクトは、モデルによって出力されたコンテンツに対して法的責任を一切負わず、関連リソースの使用および出力結果から生じる可能性のある損失についても責任を負いません。
技術文書は近日公開予定です。