近期,一項發表在《JAMA 網路開放》期刊上的研究引發廣泛關注:OpenAI 的ChatGPT-4 在醫療診斷準確性測試中表現優異,其診斷準確率高達90%,甚至超過了使用該工具輔助診斷的醫生(76%)。這項研究對50位醫生進行測試,使用了真實的、未公開的複雜病例,有效避免了先驗知識的影響。研究結果不僅凸顯了人工智慧在醫療領域的巨大潛力,也揭示了醫生在使用AI工具時可能面臨的挑戰,例如對自身診斷的過度自信以及對AI工具能力的低估。
近年來,人工智慧在醫療領域的應用不斷擴大。最近,一項研究顯示,OpenAI 開發的聊天機器人ChatGPT-4在診斷準確性方面竟然超越了醫生,引發了廣泛的討論和關注。
這項研究發表於《JAMA 網路開放》期刊,測試了50位醫師在六個複雜病例上的表現。結果顯示,使用ChatGPT 輔助的醫師平均得分為76%,未使用該工具的醫師僅74%。令人震驚的是,ChatGPT 單獨診斷時的準確率達到了90%。
圖源備註:圖片由AI生成,圖片授權服務商Midjourney
研究者為了避免參與者或AI 模型的先驗知識,使用了真實的、未公開的病例歷史。這些病例包括一些複雜的醫療狀況,例如膽固醇栓塞,這是一種常常被忽視的稀有疾病。醫生在獨立醫療專家的評分下,提供可能的診斷、排除替代方案並建議下一步的診斷步驟。儘管許多醫生得到了ChatGPT 的支持,但他們仍然難以匹敵AI 的表現。
研究揭示了兩個主要問題:首先,醫生們往固守自己的初始診斷,尤其是在ChatGPT 的建議與他們的看法相悖時。其次,許多醫生沒有充分利用AI 工具的能力,往往只提出狹窄的問題,而未能全面分析病例歷史。
專家認為,現代AI 工具透過語言模型對複雜病例進行細緻分析,展現了巨大的潛力。與早期電腦輔助診斷不同,現代AI 工具並非試圖模擬人類推理,而是透過處理和預測語言模式而表現出色。
儘管如此,專家警告說,將AI 融入醫療工作流程的過程不會一帆風順。常見的挑戰包括缺乏AI 培訓、醫生對AI 的抵觸情緒以及有關倫理和法律的擔憂。這些因素都可能阻礙AI 作為「醫師延伸工具」 的潛力,影響其在提高診斷準確性方面的作用。
研究人員在分析聊天記錄時發現,許多醫生忽略了ChatGPT 的建議。這種抵制心理部分源自於他們對自身專業知識的過度自信,同時也因為缺乏對AI 診斷能力的了解。
這項研究的結果強調了AI 開發者與醫療專業人員之間合作的重要性,以增強信任和可用性。未來,AI 在醫學中的角色可能會超越診斷,並延伸至個人化治療規劃和病人管理等領域。儘管AI 是一個非凡的工具,但如何有效地將其融入醫療實踐中仍需要大量的努力。
劃重點:
ChatGPT-4在醫療診斷研究中表現出90% 的準確率,超越了醫生使用ChatGPT 輔助的76% 。
醫生往往對自己的初步診斷過於自信,忽略了AI 建議。
AI 工具在醫療中的潛力巨大,但缺乏培訓和信任是當前主要挑戰。
總而言之,這項研究為人工智慧在醫療領域的應用提供了新的視角,也提出了許多需要進一步探討的問題。未來,AI與醫師的有效協作將是提升醫療診斷準確性與效率的關鍵。 需要進一步的研究來解決倫理、法律以及醫師接受度等問題,才能更好地發揮AI在醫療領域的潛力。