近年来,人工智能在医疗领域的应用备受关注,尤其以ChatGPT为代表的聊天机器人被寄予厚望,希望能提升医生的诊断效率。然而,最新发表在《JAMA Network Open》期刊上的研究却显示,ChatGPT并未显着提高医生的诊断能力,这引发了人们对AI在医疗诊断应用中的潜力和局限性的重新思考。这项研究对50位医生进行了实验,结果显示,使用ChatGPT的医生与仅使用传统资源的医生在诊断准确率上差异不大,这与ChatGPT独立诊断的高准确率形成了鲜明对比。研究也指出,实际临床环境的复杂性以及医生自身可能存在的认知偏差,都对AI辅助诊断效果产生了影响。
图源备注:图片由AI生成,图片授权服务商Midjourney
研究中,参与者为50名医生,包括26名主治医生和24名住院医生。他们被要求在一个小时内,根据六个真实的病例进行诊断。为了评估ChatGPT 的辅助效果,研究人员将医生分成两组,一组可以使用ChatGPT 和传统医疗资源,另一组则只能依靠传统资源,如临床信息平台UpToDate。
结果显示,使用ChatGPT 的医生在诊断方面的得分为76%,而仅依赖传统资源的医生得分为74%。相比之下,ChatGPT 独自完成诊断的得分高达90%。尽管ChatGPT 在独立工作时表现出色,但其与医生的结合并未带来明显的提高,令研究团队感到意外。
研究的共同第一作者、斯坦福临床卓越研究中心的博士后研究员埃桑・高(Ethan Goh)表示,这项研究的设计并未在真实的临床环境中进行,而是基于模拟数据,因此结果的适用性受到限制。他指出,医生在面对实际患者时的复杂性无法在实验中完全体现。
虽然研究表明,ChatGPT 在诊断时的表现优于部分医生,但这并不意味着AI 可以取代医生的决策。相反,Goh 强调,在使用AI 工具时,医生仍需保持监督和判断。此外,医生在诊断时可能会出现固执的倾向,已经形成的初步诊断可能会影响他们对AI 建议的接受程度,这也是未来研究需要关注的方向。
在医疗诊断的过程结束后,医生还需要回答一系列新问题,例如“如何进行正确的治疗步骤?” 和“需要进行哪些测试以指导患者下一步的行动?” 这表明AI 在医疗领域的应用仍有广阔的前景,但仍需深入探索其在实际临床中的有效性和适用性。
划重点:
研究显示,使用ChatGPT 的医生在诊断方面仅略高于传统方法的医生,未显着提高效果。
ChatGPT 独立诊断的得分为90%,表现出色,但仍需医生的监督和判断。
未来需要更多研究来探讨如何优化AI 在医疗诊断中的应用,以提高其有效性。
总而言之,这项研究为AI在医疗诊断中的应用提供了宝贵的经验,也指出了未来研究的方向。虽然ChatGPT等AI工具展现出一定的潜力,但其在实际临床应用中仍需进一步完善和优化,并需要医生谨慎使用,结合自身临床经验进行判断,才能更好地服务于患者。