Studi baru mengungkapkan bahwa ChatGPT hanya memberikan bantuan terbatas kepada dokter dalam diagnosis

Penulis：Eve Cole Waktu Pembaruan：2025-01-09 15:24:01

Dalam beberapa tahun terakhir, penerapan kecerdasan buatan di bidang medis telah menarik banyak perhatian, terutama chatbots yang diwakili oleh ChatGPT yang memiliki harapan besar. Namun, sebuah studi baru mengungkapkan keterbatasan AI dalam diagnosis medis. Editor Downcodes akan menafsirkan penelitian yang diterbitkan dalam jurnal "JAMA Network Open" ini dan menganalisis status saat ini dan arah pengembangan diagnosis medis yang dibantu AI di masa depan.

Teks: Dalam beberapa tahun terakhir, penerapan kecerdasan buatan (AI) di bidang medis semakin mendapat perhatian. Secara khusus, chatbot seperti ChatGPT diharapkan oleh banyak rumah sakit dapat digunakan sebagai alat bantu untuk meningkatkan efisiensi diagnostik dokter. Namun, penelitian yang baru dirilis menunjukkan bahwa penggunaan ChatGPT tidak meningkatkan kemampuan diagnostik dokter secara signifikan. Studi yang dipublikasikan di jurnal JAMA Network Open ini mengungkap potensi dan keterbatasan AI dalam diagnosis medis.

Catatan sumber gambar: Gambar dihasilkan oleh AI, dan penyedia layanan otorisasi gambar Midjourney

Dalam penelitian tersebut, pesertanya adalah 50 dokter, termasuk 26 dokter jaga dan 24 dokter residen. Mereka diminta membuat diagnosis berdasarkan enam kasus nyata dalam waktu satu jam. Untuk mengevaluasi efek tambahan ChatGPT, para peneliti membagi dokter menjadi dua kelompok, satu kelompok dapat menggunakan ChatGPT dan sumber daya medis tradisional, dan kelompok lainnya hanya dapat mengandalkan sumber daya tradisional, seperti platform informasi klinis UpToDate.

Hasilnya menunjukkan bahwa dokter yang menggunakan ChatGPT memperoleh skor 76% dalam diagnosis, sedangkan dokter yang hanya mengandalkan sumber daya tradisional memperoleh skor 74%. Sebagai perbandingan, ChatGPT mencapai skor diagnostik sebesar 90%. Meskipun ChatGPT bekerja dengan baik ketika bekerja secara mandiri, kombinasinya dengan dokter tidak menghasilkan perbaikan yang signifikan, hal ini mengejutkan tim peneliti.

Ethan Goh, salah satu penulis penelitian dan peneliti pascadoktoral di Stanford Center for Clinical Excellence, mengatakan penelitian ini tidak dirancang untuk dilakukan dalam lingkungan klinis nyata tetapi didasarkan pada data simulasi, sehingga hasilnya tidak dapat diterapkan. dibatasi. Dia menunjukkan bahwa kompleksitas yang dihadapi dokter ketika menangani pasien sebenarnya tidak dapat sepenuhnya tercermin dalam eksperimen.

Meskipun penelitian menunjukkan bahwa ChatGPT berkinerja lebih baik dibandingkan beberapa dokter dalam diagnosis, hal ini tidak berarti bahwa AI dapat menggantikan pengambilan keputusan dokter. Sebaliknya, Goh menekankan bahwa dokter tetap perlu menjaga pengawasan dan penilaian saat menggunakan alat AI. Selain itu, dokter mungkin keras kepala saat membuat diagnosis, dan diagnosis awal yang mereka buat dapat memengaruhi penerimaan mereka terhadap rekomendasi AI. Hal ini juga merupakan arah yang perlu menjadi fokus penelitian di masa depan.

Setelah proses diagnosis medis selesai, dokter juga perlu menjawab serangkaian pertanyaan baru, seperti “Bagaimana cara melanjutkan langkah pengobatan yang benar?” dan “Tes apa saja yang diperlukan untuk memandu langkah pasien selanjutnya?” Penerapan AI di bidang medis masih memiliki prospek yang luas, namun efektivitas dan penerapannya dalam praktik klinis aktual masih perlu dieksplorasi secara mendalam.

Secara keseluruhan, penelitian ini mengingatkan kita bahwa penerapan AI di bidang medis tidak terjadi dalam semalam dan memerlukan evaluasi yang cermat atas keterbatasannya serta perhatian terhadap situasi aktual dokter saat menggunakan alat AI. Di masa depan, cara mengintegrasikan teknologi AI ke dalam praktik klinis dengan lebih baik akan menjadi arah penting untuk eksplorasi lanjutan di bidang medis.