ドクスクライブ
1.0.0
DocScribe は、医療データの扱い方に革命をもたらす医療質疑応答チャットボットです。 DocScribe は、一般的な医療に関する質問と患者固有の質問の両方に迅速かつ正確に回答します。私たちの主な目標は、医療レポートのアクセシビリティと理解を強化することです。 DocScribe は以下を通じてこれを実現します。
DocScribe のアーキテクチャは、ユーザーと医療データ間のシームレスな対話を促進します。これには以下が組み込まれています。
私たちのプロジェクトでは、次のようなさまざまなデータ ソースを活用してモデルをトレーニングします。
データセット | 命令 | 入力 | 出力 |
---|---|---|---|
ウィキドキュメント | この質問に正直に答えてください | 肺扁平上皮癌の概要を教えていただけますか? | 肺の扁平上皮癌は、WHO の組織学的分類システムに従って、乳頭状、明細胞、小細胞、および基底細胞の 4 つの主要なタイプに分類されます。 |
ウィキ患者 | この質問に正直に答えてください | アルストローム症候群の場合、いつ緊急医療を受ける必要がありますか? | あなたまたはあなたのお子様に、喉の渇きや排尿の増加などの糖尿病の症状がある場合は、医療提供者に連絡してください。お子様が正常に見えたり聞こえなかったりすると思われる場合は、直ちに医師の診察を受けてください。 |
MTサンプル | 指定された医療記録に基づいて、LLM をトレーニングするためのプロンプトと回答を生成します | 患者の術前診断は何でしたか? | 患者の術前診断は前立腺がんでした。 |
LoRA、PEFT、ビットサンドバイトで微調整された Vicuna-13B モデルを選択しました。私たちのアプローチは厳格なテストを通じて検証され、医療データの解釈において有望な結果が示されています。
DocScribe は、医療上の質問の処理と患者の報告の要約において優れた能力を示しています。将来の方向性としては、医療コーパスに対するモデルのトレーニングの拡大、医療画像分析の組み込み、臨床研究での応用の検討などが含まれます。
git clone https://github.com/kmnis/DocScribe.git
cd DocScribe
pip install -r requirements.txt
# Start the jupyter server by running
jupyter notebook
# Open your browser and open http://localhost:8888/inference and open a notebook