文档抄写员
1.0.0
DocScribe 是一款医疗问答聊天机器人,它彻底改变了我们与医疗数据交互的方式。 DocScribe 对一般医疗询问和患者特定问题提供快速、准确的答复。我们的主要目标是提高医疗报告的可访问性和理解性。 DocScribe 通过以下方式实现这一目标:
DocScribe 的架构有利于用户和医疗数据之间的无缝交互。它包括:
我们的项目利用各种数据源来训练我们的模型,包括:
数据集 | 操作说明 | 输入 | 输出 |
---|---|---|---|
维基文档 | 如实回答这个问题 | 您能否概述一下肺鳞状细胞癌? | 根据WHO组织学分类系统,肺鳞状细胞癌可分为4种主要类型:乳头状癌、透明细胞癌、小细胞癌和基底样细胞癌。 |
维基病人 | 如实回答这个问题 | 当我患有阿尔斯特罗姆综合征时,何时需要寻求紧急医疗护理? | 如果您或您的孩子出现糖尿病症状,例如口渴和排尿增多,请致电您的医疗保健提供者。如果您认为您的孩子无法正常视力或听力,请立即就医。 |
MT样品 | 根据给定的医疗成绩单生成提示和答案以培训法学硕士 | 患者的术前诊断是什么? | 患者术前诊断为前列腺癌。 |
我们选择了 Vicuna-13B 模型,并使用 LoRA、PEFT 和 BitsandBytes 进行了微调。我们的方法通过严格的测试得到验证,并在解释医学数据方面显示出有希望的结果。
DocScribe 在处理医疗查询和总结患者报告方面表现出了非凡的熟练程度。未来的方向包括扩大模型在医学语料库上的训练,纳入医学图像分析,并探索其在临床研究中的应用。
git clone https://github.com/kmnis/DocScribe.git
cd DocScribe
pip install -r requirements.txt
# Start the jupyter server by running
jupyter notebook
# Open your browser and open http://localhost:8888/inference and open a notebook