DocScribe est un chatbot médical de questions et réponses qui révolutionne la façon dont nous interagissons avec les données médicales. DocScribe fournit des réponses rapides et précises aux demandes de renseignements médicaux généraux et aux questions spécifiques aux patients. Notre objectif principal est d’améliorer l’accessibilité et la compréhension des rapports médicaux. DocScribe y parvient grâce à :
L'architecture de DocScribe facilite une interaction transparente entre les utilisateurs et les données médicales. Il intègre :
Notre projet exploite un large éventail de sources de données pour entraîner notre modèle, notamment :
Ensemble de données | Instruction | Saisir | Sortir |
---|---|---|---|
Wikidoc | Répondez honnêtement à cette question | Pouvez-vous donner un aperçu du carcinome épidermoïde du poumon ? | Le carcinome épidermoïde du poumon peut être classé selon le système de classification histologique de l'OMS en 4 types principaux : papillaire, à cellules claires, à petites cellules et basaloïde. |
WikiPatient | Répondez honnêtement à cette question | Quand consulter un médecin d'urgence si j'ai le syndrome d'Alström ? | Appelez votre médecin si vous ou votre enfant présentez des symptômes de diabète tels qu'une soif et une miction accrues. Consultez rapidement un médecin si vous pensez que votre enfant ne peut pas voir ou entendre normalement. |
Échantillons MT | Sur la base du relevé de notes médical donné, générer une invite et une réponse pour former le LLM | Quel était le diagnostic préopératoire du patient ? | Le diagnostic préopératoire du patient était un cancer de la prostate. |
Nous avons opté pour le modèle Vicuna-13B, affiné avec LoRA, PEFT et bitsandbytes. Notre approche a été validée par des tests rigoureux et a montré des résultats prometteurs dans l’interprétation des données médicales.
DocScribe a fait preuve d'une compétence remarquable dans le traitement des requêtes médicales et la synthèse des rapports des patients. Les orientations futures incluent l'élargissement de la formation du modèle sur les corpus médicaux, l'intégration de l'analyse d'images médicales et l'exploration de son application dans la recherche clinique.
git clone https://github.com/kmnis/DocScribe.git
cd DocScribe
pip install -r requirements.txt
# Start the jupyter server by running
jupyter notebook
# Open your browser and open http://localhost:8888/inference and open a notebook