醫師不敵AI：ChatGPT 診斷準確率高達90%！ - AI文章

作者：Eve Cole 更新時間：2025-01-26 07:00:02

近期，一項發表在《JAMA 網路開放》期刊上的研究引發廣泛關注：OpenAI 的ChatGPT-4 在醫療診斷準確性測試中表現優異，其診斷準確率高達90%，甚至超過了使用該工具輔助診斷的醫生（76%）。這項研究對50位醫生進行測試，使用了真實的、未公開的複雜病例，有效避免了先驗知識的影響。研究結果不僅凸顯了人工智慧在醫療領域的巨大潛力，也揭示了醫生在使用AI工具時可能面臨的挑戰，例如對自身診斷的過度自信以及對AI工具能力的低估。

近年來，人工智慧在醫療領域的應用不斷擴大。最近，一項研究顯示，OpenAI 開發的聊天機器人ChatGPT-4在診斷準確性方面竟然超越了醫生，引發了廣泛的討論和關注。

這項研究發表於《JAMA 網路開放》期刊，測試了50位醫師在六個複雜病例上的表現。結果顯示，使用ChatGPT 輔助的醫師平均得分為76%，未使用該工具的醫師僅74%。令人震驚的是，ChatGPT 單獨診斷時的準確率達到了90%。

AI 医疗

圖源備註:圖片由AI生成，圖片授權服務商Midjourney

研究者為了避免參與者或AI 模型的先驗知識，使用了真實的、未公開的病例歷史。這些病例包括一些複雜的醫療狀況，例如膽固醇栓塞，這是一種常常被忽視的稀有疾病。醫生在獨立醫療專家的評分下，提供可能的診斷、排除替代方案並建議下一步的診斷步驟。儘管許多醫生得到了ChatGPT 的支持，但他們仍然難以匹敵AI 的表現。

研究揭示了兩個主要問題:首先，醫生們往固守自己的初始診斷，尤其是在ChatGPT 的建議與他們的看法相悖時。其次，許多醫生沒有充分利用AI 工具的能力，往往只提出狹窄的問題，而未能全面分析病例歷史。

專家認為，現代AI 工具透過語言模型對複雜病例進行細緻分析，展現了巨大的潛力。與早期電腦輔助診斷不同，現代AI 工具並非試圖模擬人類推理，而是透過處理和預測語言模式而表現出色。

儘管如此，專家警告說，將AI 融入醫療工作流程的過程不會一帆風順。常見的挑戰包括缺乏AI 培訓、醫生對AI 的抵觸情緒以及有關倫理和法律的擔憂。這些因素都可能阻礙AI 作為「醫師延伸工具」的潛力，影響其在提高診斷準確性方面的作用。

研究人員在分析聊天記錄時發現，許多醫生忽略了ChatGPT 的建議。這種抵制心理部分源自於他們對自身專業知識的過度自信，同時也因為缺乏對AI 診斷能力的了解。

這項研究的結果強調了AI 開發者與醫療專業人員之間合作的重要性，以增強信任和可用性。未來，AI 在醫學中的角色可能會超越診斷，並延伸至個人化治療規劃和病人管理等領域。儘管AI 是一個非凡的工具，但如何有效地將其融入醫療實踐中仍需要大量的努力。

劃重點:

ChatGPT-4在醫療診斷研究中表現出90% 的準確率，超越了醫生使用ChatGPT 輔助的76% 。

醫生往往對自己的初步診斷過於自信，忽略了AI 建議。

AI 工具在醫療中的潛力巨大，但缺乏培訓和信任是當前主要挑戰。

總而言之，這項研究為人工智慧在醫療領域的應用提供了新的視角，也提出了許多需要進一步探討的問題。未來，AI與醫師的有效協作將是提升醫療診斷準確性與效率的關鍵。需要進一步的研究來解決倫理、法律以及醫師接受度等問題，才能更好地發揮AI在醫療領域的潛力。