QiZhenGPT: модель большого языка китайской медицины с открытым исходным кодом
В этом проекте используется набор данных китайских медицинских инструкций, созданный Базой медицинских знаний Qizhen, и на основе этого инструкции точно настраиваются на моделях Chinese-LLaMA-Plus-7B, CaMA-13B и ChatGLM-6B, что значительно улучшает эффективность модели в китайских медицинских сценариях. Чтобы достичь желаемых результатов, мы сначала опубликовали набор оценочных данных для вопросов и ответов о знаниях о лекарствах, с последующими планами по оптимизации влияния вопросов и ответов на заболевания, операции, тесты и т. д., а также расширение таких приложений, как Вопросы и ответы врача и пациента и автоматическое создание медицинских записей.
MedCopilot
— это интеллектуальный медицинский помощник, разработанный на основе启真医学大模型
, базы медицинских знаний Qizhen и医疗临床数据
. Он призван обеспечить комплексную интеллектуальную поддержку пациентов, врачей и руководства больницы. Объединив передовые технологии искусственного интеллекта, богатые медицинские знания и клинические данные, MedCopilot станет новой производительной силой в медицинской отрасли.
MedCopilot был официально запущен во второй дочерней больнице Чжэцзянского университета.
[2024/08/09] Обновление информации, связанной с MedCopilot;
[2023/06/27] Пробная версия большой медицинской модели QiZhen с открытым исходным кодом (QiZhen-CaMA-13B-Checkpoint-12400) направлена на повышение точности знаний вопросов и ответов о заболеваниях и лекарствах в области медицины;
[2023/06/09] Пробная версия большой медицинской модели QiZhen с открытым исходным кодом (QiZhen-CaMA-13B-Checkpoint-6000) предназначена для повышения точности вопросов и ответов о знаниях о лекарствах в медицинской сфере;
[2023/06/02] Пробная версия большой медицинской модели QiZhen с открытым исходным кодом (QiZhen-CaMA-13B-Checkpoint-3600) предназначена для повышения точности вопросов и ответов о лекарствах в медицинской сфере;
[2023/05/30] 20 тыс. обучающих данных с открытым исходным кодом (этот набор данных основан на реальных данных вопросов и ответов о знаниях врача и пациента, собранных и скомпилированных Медицинской базой знаний Qizhen и основанных на текстовых знаниях о лекарствах из Медицинской базы знаний Qizhen, через полу -структурированные данные устанавливают данные инструкций, созданные по конкретному шаблону вопроса);
[2023/05/30] Пробная версия большой медицинской модели QiZhen с открытым исходным кодом (QiZhen-ChatGLM-6B-Checkpoint-2500) предназначена для повышения точности вопросов и ответов о знаниях о лекарствах в медицинской сфере;
[2023/05/25] Набор данных для оценки показаний к применению лекарств из открытых источников;
[2023/05/24] Пробная версия большой медицинской модели QiZhen с открытым исходным кодом (QiZhen-Chinese-LLaMA-7B-Checkpoint-6000) предназначена для повышения точности вопросов и ответов о знаниях о лекарствах в медицинской сфере;
[2023/05/23] Пробная версия большой медицинской модели QiZhen с открытым исходным кодом (QiZhen-Chinese-LLaMA-7B-Checkpoint-3500) предназначена для повышения точности вопросов и ответов о лекарствах в медицинской сфере;
MedCopilot глубоко интегрирован с системой HIS и системой электронных медицинских карт. Он использует большую модель Qizhen Medical для анализа данных из каждой системы и автоматического обобщения важных задач врача за день.
MedCopilot объединяет базу медицинских знаний Qizhen и клинические данные пациентов, чтобы предоставить персонализированные рекомендации по диагностике и лечению, которые помогут врачам принимать более точные медицинские решения.
В соответствии с национальной политикой качества медицинской помощи, MedCopilot отслеживает данные медицинских процессов в режиме реального времени, своевременно выявляет и исправляет потенциальные проблемы, а также улучшает общее качество медицинской помощи.
MedCopilot комплексно анализирует данные о диагнозе и лечении пациентов и автоматически генерирует медицинские документы, соответствующие нормативам, сокращая рутинную работу врачей и повышая эффективность работы.
В настоящее время большинство проектов ChatLLM с открытым исходным кодом используют данные инструкций, сгенерированные другими моделями (например, ChatGPT), что неизбежно приводит к проблеме иллюзии данных. Проблема иллюзии данных серьезно повлияет на применение и расширение LLM в реальных сценариях. Таким образом, чтобы повысить точность вопросов и ответов в области медицины, в этом проекте используется следующий метод для построения набора данных инструкций:
560K
данных инструкций;180K
данных инструкций;298K
данных инструкций;3500 steps
(тренировка 23ч50мин);6000 steps
(тренировка 40х56мин);2500 steps
процесса обучения. (тренировка 16ч20мин);3600 steps
процесса обучения. (тренировка 37ч37мин).6000 steps
процесса обучения. (тренировка 54ч30мин).12400 steps
процесса обучения. (тренировка 114ч46мин).Модель | набор данных инструкций | Базовая модель | ЛоРА скачать |
---|---|---|---|
QiZhen-Китайский-LLaMA-7B-КПП-3500 | 740 тыс. | Китайский-LLaMA-Plus-7B | Байду Скайдиск |
QiZhen-Китайский-LLaMA-7B-КПП-6000 | 740 тыс. | Китайский-LLaMA-Plus-7B | Байду Скайдиск |
QiZhen-ChatGLM-6B-КПП-2500 | 740 тыс. | ЧатGLM-6B | Байду Скайдиск |
QiZhen-CaMA-13B-КПП-3600 | 740 тыс. | КаМА | Байду Скайдиск |
QiZhen-CaMA-13B-КПП-6000 | 740 тыс. | КаМА | Байду Скайдиск |
QiZhen-CaMA-13B-Checkpoint-12400 | 1038К | КаМА | Байду Скайдиск |
pip install -r requirements.txt
Приобретите Chinese-LLaMA-Plus-7B, подробности см. здесь;
Скачайте LoRA, загрузите модель и поместите ее в каталог lora;
Выполнить скрипты/скрипт merge_llama_plus.sh;
sh scripts/merge_llama_plus.sh
gradio_chinese-llama_demo.py
; python gradio_chinese-llama_demo.py
pip install -r requirements.txt
Получите ChatGLM-6B, подробности см. здесь;
Скачайте LoRA, загрузите модель и поместите ее в каталог lora;
Измените параметры положения модели в gradio_chatglm_demo.py
;
Запустить демо-версию;
python gradio_chatglm_demo.py
pip install -r requirements.txt
Получите CaMA, подробности здесь;
Скачайте LoRA, загрузите модель и поместите ее в каталог lora;
Измените параметры положения модели в gradio_cama_demo.py
;
Запустить демо-версию;
python gradio_cama_demo.py
Большая медицинская модель Qizhen придерживается технического маршрута «данные + знания на двух колесах». Благодаря тесной интеграции технологий больших моделей и базы медицинских знаний она объединяет реальные потребности в сценариях медицинского применения, от управления медицинскими данными до медицинских рассуждений. , вопросы и ответы врача и пациента. Будут проводиться итеративные исследования и разработки в таких областях, как автоматическое создание медицинских записей и системы поддержки принятия клинических решений, чтобы облегчить внедрение и применение технологий больших моделей в медицинской промышленности. На рисунке ниже показан случай «База медицинских знаний Qizhen помогает большой модели генерировать ответы». Эта технология была выпущена после тестирования.
Вводные данные: Показания к инъекции флуфеназина деканоата.
ChatGLM: инъекция деканоата флуфеназина — препарат со следующими показаниями: 1. Используется для лечения нервно-психических симптомов, таких как депрессия, тревога и бессонница. 2. Используется для лечения эпилепсии, травм головного мозга, церебрального атеросклероза и других неврологических заболеваний; для облегчения хронической боли, такой как дисменорея, артрит и другие болезненные заболевания. 4. Используется для улучшения способности к обучению и памяти, может использоваться для интеллектуального развития и улучшения обучаемости детей и подростков. 5. Используется для профилактики ВИЧ; инфекция и лечение СПИДа. Флуфеназин деканоат для инъекций — это пероральный препарат, обычно используемый для лечения депрессии, тревоги и бессонницы. План лечения должен быть составлен на основе рекомендаций врача. При использовании флуфеназина деканоата для инъекций вы должны следовать советам врача, а также инструкциям по приему лекарства и дозировке, указанным в инструкции к препарату.
ChatGPT: инъекция флумазенила деканоата (инъекция флумазенила) — препарат, используемый для лечения седативных или снотворных состояний, вызванных передозировкой или чрезмерным употреблением бензодиазепинов (например, препаратов диазепама). Он действует как антагонист бензодиазепиновых рецепторов и может обратить вспять угнетающее действие бензодиазепинов на центральную нервную систему. <Инъекции флуфеназина деканоата в основном используются по следующим показаниям:
1. Передозировка бензодиазепинов. Когда у пациентов возникают такие симптомы, как кома, сонливость и угнетение дыхания из-за передозировки или чрезмерного употребления препаратов диазепама, для устранения этих симптомов можно использовать инъекцию флуфеназина деканоата.
2. Реверс во время анестезии: инъекцию флуфеназина деканоата можно использовать для отмены седативного действия бензодиазепинов после операции или других анестезиологических процедур и помочь пациентам вернуться в сознательное состояние.
3. Диагностическое применение: инъекцию деканоата флуфеназина также можно использовать для диагностики отравления или передозировки бензодиазепинов.
Обратите внимание, что инъекции флуфеназина деканоата следует использовать рационально и под наблюдением профессионального врача с учетом конкретных обстоятельств. Перед использованием этого лекарства внимательно прочитайте и следуйте инструкциям по применению препарата, а также следуйте инструкциям и рекомендациям врача.
QiZhen-Chinese-LLaMA-7B-Checkpoint-3500: Этот продукт используется при шизофрении, мании и т. д. Его также можно использовать при миотонической боли.
QiZhen-CaMA-13B-Checkpoint-3600: Этот продукт применяется при различных проявлениях шизофрении.
ввод: Каковы основные функции тибетского зеленого фруктового чая?
ChatGLM: Тибетский зеленый фруктовый чай — это натуральный напиток, в основном изготовленный из зеленых фруктов, чайных листьев, меда и других материалов. Его основные функции включают в себя: 1. Повышение иммунитета: тибетский зеленый фруктовый чай богат питательными веществами, такими как витамин С, витамин Е и т. д., которые могут повысить иммунитет организма, повысить сопротивляемость организма и предотвратить возникновение заболеваний. 2. Способствует пищеварению: тибетский зеленый фруктовый чай богат клетчаткой, которая способствует моторике желудочно-кишечного тракта, помогает пищеварению и предотвращает запоры. 3. Антиоксидантный эффект: экстракт зеленых фруктов в тибетском зеленом фруктовом чае обладает сильным антиоксидантным действием, которое может удалять свободные радикалы в организме, замедлять старение и предотвращать заболевания. 4. Снижение уровня липидов в крови: экстракт тибетского зеленого фруктового чая оказывает определенное влияние на снижение уровня липидов в крови и может предотвращать и лечить гиперлипидемию. 5. Улучшение сна. Мед в тибетском зеленом фруктовом чае обладает определенным седативным эффектом, который может помочь снять стресс, улучшить качество сна и улучшить способность организма к самовосстановлению.
ChatGPT: Тибетский зеленый фруктовый чай — это чайный напиток, приготовленный из тибетских зеленых фруктов в качестве основного сырья. Насколько мне известно, он выполняет следующие основные функции:
1. Антиоксидантный эффект: тибетские зеленые фрукты богаты различными природными антиоксидантами, такими как полифенолы и витамин С, которые могут помочь удалить свободные радикалы в организме, замедлить старение клеток и повысить иммунитет.
2. Способствует пищеварению: тибетский зеленый фруктовый чай оказывает хорошее стимулирующее пищеварение действие, способствует улучшению перистальтики желудочно-кишечного тракта, улучшает пищеварительную функцию и снимает дискомфорт в желудке и расстройство желудка.
3. Обеспечьте питание: тибетские зеленые фрукты богаты витамином С, витамином Е, комплексом витаминов группы В, минералами и другими питательными веществами. Употребление тибетского зеленого фруктового чая может обеспечить организм необходимыми питательными веществами.
4. Снижение веса. Считается, что тибетский зеленый фруктовый чай способствует снижению веса. Он способствует обмену веществ, ускоряет разложение и сжигание жира, а также помогает уменьшить вес и накопление жира.
5. Противовоспалительное и болеутоляющее действие. Тибетский зеленый фруктовый чай содержит некоторые ингредиенты с противовоспалительным и обезболивающим действием, которые могут облегчить дискомфорт, такой как боль в суставах, болезненность мышц и головные боли.
6. Улучшение сна: тибетский зеленый фруктовый чай помогает расслабить нервную систему, оказывает успокаивающее и успокаивающее действие, может улучшить качество сна и облегчить проблемы с бессонницей.
Следует отметить, что вышеуказанные эффекты в основном основаны на традиционном использовании тибетского зеленого фруктового чая и определенных результатах исследований. Конкретные эффекты варьируются от человека к человеку и могут зависеть от индивидуальных различий и методов использования. Если у вас есть определенное состояние здоровья или вам необходимо принимать лекарства, рекомендуется обратиться за консультацией к врачу или медицинскому работнику.
QiZhen-Chinese-LLaMA-7B- Checkpoint-3500: отводит тепло, выводит токсины, вырабатывает жидкости организма и утоляет жажду. Он может облегчить такие симптомы, как жар, жажда и боль в горле.
QiZhen-CaMA-13B-Checkpoint-3600: Скрытый синий фруктовый чай снимает жар, успокаивает горло, уменьшает отек и облегчает боль.
Тибетский зеленый фруктовый чай можно использовать для облегчения таких симптомов, как покраснение и боль в горле, сухость и жжение в горле, охриплость голоса и другие симптомы.
ввод: Каковы клинические проявления синдрома Рейтера?
ChatGLM: Синдром Рейтера (синдром Рейтера I типа) — врожденный шум в сердце, клинические проявления которого включают:
Шумы в сердце. Характерным шумом в сердце при синдроме Райта I типа является шум шунта справа налево, вызванный открытым овальным окном, который обычно характеризуется вариабельностью интенсивности, местоположения и частоты шума.
Легочная гипертензия. Люди с синдромом Рейтера I типа часто страдают легочной гипертензией, которая может привести к дыхательной недостаточности и сердечной недостаточности.
Аномалии роста и развития. У большинства людей с синдромом Рейтера I типа наблюдаются аномалии роста и развития, такие как низкий рост, недостаточное питание и гигантизм в детстве и подростковом возрасте.
Структурные аномалии сердца. Хотя шумы являются основным клиническим проявлением синдрома Рейтера I типа, у некоторых пациентов могут также наблюдаться другие структурные аномалии сердца, такие как заболевания сердечных клапанов и аритмии.
Другие симптомы. У людей с синдромом Рейтера I типа могут также наблюдаться другие симптомы, такие как усталость, затрудненное дыхание, боль в груди, кашель, вздутие живота и запор. Эти симптомы могут быть связаны с шумом в сердце и легочной гипертензией, но они также могут быть связаны с другими факторами.
Следует отметить, что синдром Рейтера I типа является редким заболеванием, и его клинические проявления могут варьировать в зависимости от индивидуальных различий. Если вы подозреваете, что у вас синдром Рейтера I типа, немедленно обратитесь к врачу для диагностики и лечения.
ChatGPT: синдром Рейтера относится к заболеванию, вызванному ахалазией нижнего пищеводного сфинктера и ослаблением моторики пищевода, вызванным гастроэзофагеальной рефлюксной болезнью (ГЭРБ). К основным клиническим проявлениям относятся:
Дисфагия: пациент чувствует себя застрявшим при глотании, и ему необходимо сглотнуть несколько раз, чтобы проглотить пищу.
Боль в груди. Люди с синдромом Рейтера часто испытывают боль в груди, особенно после еды или лежания.
Отрыжка и кислотный рефлюкс. Пациенты часто испытывают отрыжку и кислотный рефлюкс, особенно после еды или лежания.
Охриплость голоса: голос пациента может стать хриплым из-за раздражения области рта и горла рефлюксным материалом.
Боль в горле: материал рефлюкса раздражает слизистую оболочку горла.
Важно отметить, что симптомы синдрома Рейтера аналогичны симптомам других заболеваний, поэтому диагноз необходимо подтвердить соответствующими обследованиями и методами диагностики.
QiZhen-CaMA-13B-Checkpoint-12400: Основными клиническими проявлениями синдрома Рейтера являются острый или хронический артрит, уретрит, конъюнктивит, а также поражения кожи и слизистых оболочек.
Синдром Рейтера — хроническое неспецифическое воспалительное заболевание неясной этиологии. Это разновидность серонегативного спондилоартрита. Характеризуется рецидивирующим, мигрирующим, асимметричным полиартритом, который может сопровождаться воспалительным поражением уретры, конъюнктивитом, кожей, слизистыми оболочками. и поражения глаз.
Основными клиническими проявлениями синдрома Рейтера являются острый или хронический артрит, уретрит, конъюнктивит, поражение кожи и слизистых оболочек.
1. Артрит. Чаще всего может поражаться любой сустав, чаще всего наблюдаются мелкие суставы колен, голеностопных суставов и стоп. Могут возникнуть локальное покраснение, отек, жар, боль и дисфункция.
2. Уретрит: проявляется учащенным мочеиспусканием, позывами к мочеиспусканию, дизурией, покраснением и отеком устья уретры, усилением уретрального секрета и т. д.
3. Конъюнктивит: проявляется как одностороннее или двустороннее воспаление конъюнктивы, которое может включать застой конъюнктивы, отек, отек век, усиление секреции и т. д.
4. Поражения кожи и слизистых оболочек: проявляются в виде себорейной эритемы, генитальной эритемы, пустул, пустул на коже и язв на коже.
Критерии оценки: случайным образом выберите 94
типа данных о лекарстве, следуйте инструкциям по составу «Показания для {препарата}», дайте ChatGPT (gpt3.5), ChatGLM и QiZhe ответить соответственно, а затем попросите профессионального медицинского персонала模型的答案
Сравнить и оцените с помощью该药品的药品说明书
. Ниже приведены три критерия оценки:
Стандарт 1: Если ответ модели соответствует одному указанию, ответ правильный;
Стандарт 2: Если количество показаний, указанных в типовом ответе, больше или равно 1/2 количества показаний, указанных во вкладыше к упаковке препарата, ответ правильный;
Стандарт 3: Если количество показаний, указанных в типовом ответе, больше или равно 2/3 количества показаний во вкладыше к упаковке препарата, ответ правильный;
Модель | Стандарт 1 | Стандарт 2 | Стандарт 3 |
---|---|---|---|
ЧатGLM | 39,36% | 23,16% | 14,74% |
ЧатGPT | 47,87% | 30,85% | 15,96% |
QiZhen-Китайский-LLaMA-7B-КПП-3500 | 77,66% | 55,32% | 40,00% |
QiZhen-Китайский-LLaMA-7B-Checkpoint-6000 | 90,43% | 73,40% | 65,96% |
QiZhen-CaMA-13B-КПП-3600 | 82,29% | 60,62% | 47,92% |
QiZhen-CaMA-13B-КПП-6000 | 90,43% | 80,85% | 72,34% |
QiZhen-CaMA-13B-Checkpoint-12400 | 91,49% | 82,98% | 72,34% |
Примечание:
repetition_penalty
;QiZhen-CaMA-13B-Checkpoint-3600
мы увеличили количество параметров LoRA, и эффект был эффективно улучшен; Критерии оценки: Случайным образом выберите 100
данных о заболевании и сформируйте «терапевтические препараты» в соответствии с «Какими препаратами можно лечить {болезнь}?», «Какие обследования необходимы при {болезни}?», «Каковы клинические проявления {заболевания}?» ?", "Осмотр" и "Клинические проявления" относятся к Прикажите ChatGPT (gpt3.5), ChatGLM и QiZhen0 ответить соответственно, а затем попросите профессионального медицинского персонала сравнить и оценить模型的答案
со启真医学知识库疾病知识
. Ниже приведены три стандарта оценки. :
Стандарт 1: Если модельный ответ соответствует «терапевтическому препарату» («экспертиза», «клиническое проявление»), то ответ правильный;
Стандарт 2: Если количество «лечебных препаратов» («экспертизационных испытаний», «клинических проявлений»), попадающих в модельный ответ, больше или равно 1/2 количества показаний в инструкции к препарату, ответ правильный. ;
Стандарт 3: Если количество «лечебных препаратов» («проверочных испытаний», «клинических проявлений»), попадающих в модельный ответ, больше или равно 2/3 количества показаний в инструкции к препарату, ответ правильный. ;
Модель | Стандарт клинической эффективности 1 | Критерии клинической эффективности 2 | Критерии клинической эффективности 3 | Проверьте стандарты проверки 1 | Проверьте стандарт проверки 2 | Проверьте стандарт проверки 3 | Стандарты терапевтических препаратов 1 | Стандарты терапевтических лекарственных средств 2 | Стандарты терапевтических лекарственных средств 3 |
---|---|---|---|---|---|---|---|---|---|
чатглм | 90,00% | 6,00% | 3,00% | 93,00% | 11,00% | 6,00% | 60,00% | 10,00% | 5,00% |
чатgpt | 94,00% | 11,00% | 4,00% | 97,00% | 8,00% | 5,00% | 62,00% | 11,00% | 4,00% |
QiZhen-CaMA-13B-Checkpoint-12400 | 95,00% | 15,00% | 7,00% | 97,00% | 20,00% | 7,00% | 75,00% | 36,00% | 23,00% |
Кроме того, этот проект основан на вторичной разработке следующих проектов с открытым исходным кодом. Я хотел бы выразить благодарность соответствующим проектам и научно-исследовательскому персоналу.
Подробности см. в ЛИЦЕНЗИИ.
Ресурсы, связанные с этим проектом, предназначены только для академических исследований и строго запрещены для коммерческого использования. При использовании частей, включающих сторонний код, строго следуйте соответствующему соглашению об открытом исходном коде. На контент, генерируемый моделью, влияют такие факторы, как расчет модели, случайность и потеря точности количественного определения, и этот проект не гарантирует его точность. Этот проект не несет никакой юридической ответственности за любой контент, выводимый с помощью модели, а также за любые убытки, которые могут возникнуть в результате использования связанных ресурсов и результатов вывода.
Технический документ скоро появится.