文檔抄寫員
1.0.0
DocScribe 是一款醫療問答聊天機器人,它徹底改變了我們與醫療數據互動的方式。 DocScribe 對一般醫療詢問和患者特定問題提供快速、準確的答案。我們的主要目標是提高醫療報告的可近性和理解性。 DocScribe 透過以下方式實現這一目標:
DocScribe 的架構有利於使用者和醫療資料之間的無縫互動。它包括:
我們的專案利用各種資料來源來訓練我們的模型,包括:
數據集 | 操作說明 | 輸入 | 輸出 |
---|---|---|---|
維基文檔 | 如實回答這個問題 | 您能否概述一下肺鱗狀細胞癌? | 根據WHO組織學分類系統,肺鱗狀細胞癌可分為4種主要類型:乳頭狀癌、透明細胞癌、小細胞癌、基底樣細胞癌。 |
維基病人 | 如實回答這個問題 | 當我患有阿爾斯特羅姆症候群時,何時需要尋求緊急醫療照護? | 如果您或您的孩子出現糖尿病症狀,例如口渴和排尿增多,請致電您的醫療保健提供者。如果您認為您的孩子無法正常視力或聽力,請立即就醫。 |
MT樣品 | 根據給定的醫療成績單產生提示和答案以培訓法學碩士 | 患者的術前診斷是什麼? | 患者術前診斷為前列腺癌。 |
我們選擇了 Vicuna-13B 模型,並使用 LoRA、PEFT 和 BitsandBytes 進行了微調。我們的方法經過嚴格的測試得到驗證,並在解釋醫學數據方面顯示出有希望的結果。
DocScribe 在處理醫療查詢和總結患者報告方面表現出了非凡的熟練程度。未來的方向包括擴大模型在醫學語料庫上的訓練,納入醫學影像分析,並探索其在臨床研究中的應用。
git clone https://github.com/kmnis/DocScribe.git
cd DocScribe
pip install -r requirements.txt
# Start the jupyter server by running
jupyter notebook
# Open your browser and open http://localhost:8888/inference and open a notebook