Dalam beberapa tahun terakhir, penerapan kecerdasan buatan di bidang medis telah menarik banyak perhatian, terutama chatbots yang diwakili oleh ChatGPT, yang memiliki harapan besar untuk meningkatkan efisiensi diagnostik dokter. Namun, penelitian terbaru yang diterbitkan dalam jurnal "JAMA Network Open" menunjukkan bahwa ChatGPT tidak meningkatkan kemampuan diagnostik dokter secara signifikan, sehingga memicu pemikiran ulang tentang potensi dan keterbatasan AI dalam aplikasi diagnostik medis. Studi tersebut melakukan eksperimen terhadap 50 dokter dan menunjukkan bahwa terdapat sedikit perbedaan dalam akurasi diagnostik antara dokter yang menggunakan ChatGPT dan mereka yang hanya menggunakan sumber daya tradisional, hal ini sangat kontras dengan tingginya akurasi diagnosis independen ChatGPT. Penelitian juga menunjukkan bahwa kompleksitas lingkungan klinis aktual dan kemungkinan bias kognitif dari dokter itu sendiri berdampak pada efektivitas diagnosis yang dibantu AI.
Catatan sumber gambar: Gambar dihasilkan oleh AI, dan penyedia layanan otorisasi gambar Midjourney
Dalam penelitian tersebut, pesertanya adalah 50 dokter, termasuk 26 dokter jaga dan 24 dokter residen. Mereka diminta membuat diagnosis berdasarkan enam kasus nyata dalam waktu satu jam. Untuk mengevaluasi efek tambahan ChatGPT, para peneliti membagi dokter menjadi dua kelompok, satu kelompok dapat menggunakan ChatGPT dan sumber daya medis tradisional, dan kelompok lainnya hanya dapat mengandalkan sumber daya tradisional, seperti platform informasi klinis UpToDate.
Hasilnya menunjukkan bahwa dokter yang menggunakan ChatGPT memperoleh skor 76% dalam diagnosis, sedangkan dokter yang hanya mengandalkan sumber daya tradisional memperoleh skor 74%. Sebagai perbandingan, ChatGPT mencapai skor diagnostik sebesar 90%. Meskipun ChatGPT bekerja dengan baik ketika bekerja secara mandiri, kombinasinya dengan dokter tidak menghasilkan perbaikan yang signifikan, hal ini mengejutkan tim peneliti.
Ethan Goh, salah satu penulis penelitian dan peneliti pascadoktoral di Stanford Center for Clinical Excellence, mengatakan penelitian ini tidak dirancang untuk dilakukan dalam lingkungan klinis nyata tetapi didasarkan pada data simulasi, sehingga hasilnya tidak dapat diterapkan. dibatasi. Dia menunjukkan bahwa kompleksitas yang dihadapi dokter ketika menangani pasien sebenarnya tidak dapat sepenuhnya tercermin dalam eksperimen.
Meskipun penelitian menunjukkan bahwa ChatGPT berkinerja lebih baik dibandingkan beberapa dokter dalam diagnosis, hal ini tidak berarti bahwa AI dapat menggantikan pengambilan keputusan dokter. Sebaliknya, Goh menekankan bahwa dokter tetap perlu menjaga pengawasan dan penilaian saat menggunakan alat AI. Selain itu, dokter mungkin keras kepala saat membuat diagnosis, dan diagnosis awal yang mereka buat dapat memengaruhi penerimaan mereka terhadap rekomendasi AI. Hal ini juga merupakan arah yang perlu menjadi fokus penelitian di masa depan.
Setelah proses diagnosis medis selesai, dokter juga perlu menjawab serangkaian pertanyaan baru, seperti “Bagaimana cara melanjutkan langkah pengobatan yang benar?” dan “Tes apa saja yang diperlukan untuk memandu langkah pasien selanjutnya?” Penerapan AI di bidang medis masih memiliki prospek yang luas, namun efektivitas dan penerapannya dalam praktik klinis aktual masih perlu dieksplorasi secara mendalam.
Menyorot:
Penelitian menunjukkan bahwa dokter yang menggunakan ChatGPT hanya sedikit lebih baik dalam diagnosis dibandingkan dokter yang menggunakan metode tradisional, tanpa adanya kemajuan yang signifikan.
Skor diagnosis independen ChatGPT adalah 90%, yang sangat baik, namun tetap memerlukan pengawasan dan penilaian dokter.
Diperlukan lebih banyak penelitian di masa depan untuk mengeksplorasi cara mengoptimalkan penerapan AI dalam diagnosis medis guna meningkatkan efektivitasnya.
Secara keseluruhan, penelitian ini memberikan pengalaman berharga untuk penerapan AI dalam diagnosis medis dan juga menunjukkan arah penelitian di masa depan. Meskipun alat AI seperti ChatGPT telah menunjukkan potensi tertentu, alat tersebut masih perlu ditingkatkan dan dioptimalkan lebih lanjut dalam penerapan klinis sebenarnya, dan dokter perlu menggunakannya dengan hati-hati dan membuat penilaian berdasarkan pengalaman klinis mereka sendiri agar dapat memberikan pelayanan yang lebih baik kepada pasien.