In den letzten Jahren hat die Anwendung künstlicher Intelligenz im medizinischen Bereich viel Aufmerksamkeit erregt, insbesondere die Chatbots, die durch ChatGPT repräsentiert werden und große Hoffnungen auf eine Verbesserung der Diagnoseeffizienz von Ärzten haben. Die neueste in der Fachzeitschrift „JAMA Network Open“ veröffentlichte Studie zeigt jedoch, dass ChatGPT die Diagnosefähigkeiten von Ärzten nicht wesentlich verbessert, was ein Umdenken über das Potenzial und die Grenzen von KI in medizinischen Diagnoseanwendungen ausgelöst hat. Die Studie führte Experimente mit 50 Ärzten durch und zeigte, dass es kaum Unterschiede in der diagnostischen Genauigkeit zwischen Ärzten gab, die ChatGPT verwendeten, und solchen, die nur traditionelle Ressourcen nutzten, was in scharfem Kontrast zur hohen Genauigkeit der unabhängigen Diagnose von ChatGPT stand. Die Forschung weist auch darauf hin, dass die Komplexität des tatsächlichen klinischen Umfelds und mögliche kognitive Vorurteile der Ärzte selbst einen Einfluss auf die Wirksamkeit der KI-gestützten Diagnose haben.
Hinweis zur Bildquelle: Das Bild wird von AI und dem Bildautorisierungsdienstleister Midjourney generiert
An der Studie nahmen 50 Ärzte teil, darunter 26 Belegärzte und 24 niedergelassene Ärzte. Sie wurden gebeten, innerhalb einer Stunde eine Diagnose anhand von sechs realen Fällen zu stellen. Um den Zusatzeffekt von ChatGPT zu bewerten, teilten die Forscher Ärzte in zwei Gruppen ein: Eine Gruppe konnte ChatGPT und traditionelle medizinische Ressourcen nutzen und die andere Gruppe konnte sich nur auf traditionelle Ressourcen wie die klinische Informationsplattform UpToDate verlassen.
Die Ergebnisse zeigten, dass Ärzte, die ChatGPT nutzten, bei der Diagnose 76 % erreichten, während Ärzte, die sich ausschließlich auf traditionelle Ressourcen verließen, 74 % erreichten. Im Vergleich dazu erreichte ChatGPT allein einen Diagnosewert von 90 %. Obwohl ChatGPT bei unabhängiger Arbeit gut abschnitt, führte die Kombination mit Ärzten nicht zu signifikanten Verbesserungen, was das Forschungsteam überraschte.
Ethan Goh, Co-Erstautor der Studie und Postdoktorand am Stanford Center for Clinical Excellence, sagte, die Studie sei nicht für die Durchführung in einer realen klinischen Umgebung konzipiert, sondern basiere auf simulierten Daten, sodass die Ergebnisse nicht auf Geschlecht anwendbar seien ist eingeschränkt. Er wies darauf hin, dass die Komplexität, mit der Ärzte im Umgang mit tatsächlichen Patienten konfrontiert sind, nicht vollständig in Experimenten widergespiegelt werden kann.
Obwohl Untersuchungen zeigen, dass ChatGPT bei der Diagnose besser abschneidet als einige Ärzte, bedeutet dies nicht, dass KI die Entscheidungsfindung von Ärzten ersetzen kann. Stattdessen betonte Goh, dass Ärzte beim Einsatz von KI-Tools weiterhin die Kontrolle und das Urteilsvermögen behalten müssen. Darüber hinaus können Ärzte hartnäckig sein, wenn sie Diagnosen stellen, und die von ihnen erstellte vorläufige Diagnose kann sich auf ihre Akzeptanz von KI-Empfehlungen auswirken. Dies ist auch eine Richtung, auf die sich zukünftige Forschung konzentrieren muss.
Nach Abschluss des medizinischen Diagnoseprozesses müssen Ärzte auch eine Reihe neuer Fragen beantworten, z. B. „Wie gehen Sie mit den richtigen Behandlungsschritten vor?“ und „Welche Tests sind erforderlich, um die nächsten Schritte des Patienten zu steuern?“ Die Anwendung von KI im medizinischen Bereich hat noch große Aussichten, ihre Wirksamkeit und Anwendbarkeit in der tatsächlichen klinischen Praxis muss jedoch noch eingehend untersucht werden.
Highlight:
Untersuchungen zeigen, dass Ärzte, die ChatGPT verwenden, bei der Diagnose nur geringfügig besser sind als Ärzte, die herkömmliche Methoden verwenden, ohne nennenswerte Verbesserung.
Der unabhängige Diagnosewert von ChatGPT beträgt 90 %, was ausgezeichnet ist, aber dennoch die Aufsicht und Beurteilung eines Arztes erfordert.
In Zukunft sind weitere Forschungsarbeiten erforderlich, um herauszufinden, wie die Anwendung von KI in der medizinischen Diagnose optimiert werden kann, um deren Wirksamkeit zu verbessern.
Insgesamt liefert diese Forschung wertvolle Erfahrungen für den Einsatz von KI in der medizinischen Diagnostik und weist auch die Richtung zukünftiger Forschung auf. Obwohl KI-Tools wie ChatGPT ein gewisses Potenzial gezeigt haben, müssen sie in tatsächlichen klinischen Anwendungen noch weiter verbessert und optimiert werden, und Ärzte müssen sie mit Vorsicht verwenden und auf der Grundlage ihrer eigenen klinischen Erfahrung urteilen, um Patienten besser bedienen zu können.