Dalam beberapa tahun terakhir, teknologi kecerdasan buatan telah berkembang pesat, namun juga membawa tantangan baru - fenomena "halusinasi" AI menjadi semakin menonjol. Kasus sistem AI yang menghasilkan informasi yang salah, memalsukan data, dan bahkan memberikan saran yang berbahaya adalah hal yang umum terjadi, sehingga berdampak serius pada reputasi dan kepentingan perusahaan. Editor Downcodes akan memperkenalkan Anda kepada perusahaan rintisan dan produk inovatifnya yang didedikasikan untuk memecahkan masalah ini.
Saat ini, dengan pesatnya perkembangan kecerdasan buatan, "halusinasi" AI menjadi semakin sering terjadi, menyebabkan banyak masalah bagi banyak perusahaan. Chatbot layanan pelanggan dengan percaya diri mendeskripsikan produk yang tidak ada, AI keuangan memalsukan data pasar, dan bot medis menawarkan nasihat medis yang berbahaya. Permasalahan ini bukan lagi sekadar anekdot, namun merupakan bahaya serius yang tersembunyi yang mempengaruhi reputasi dan profitabilitas perusahaan.
Untuk mengatasi tantangan ini, startup Patronus AI yang berbasis di San Francisco mengumumkan peluncuran platform layanan mandiri pertama di dunia, yang dirancang untuk mendeteksi dan mencegah kegagalan sistem AI secara real time. Platform ini bertindak seperti “pemeriksa ejaan” untuk sistem AI, mendeteksi masalah sebelum terjadi.
Anand Kannappan, CEO Patronus AI, mengatakan dalam sebuah wawancara bahwa banyak perusahaan menghadapi kegagalan AI di lingkungan produksi, dengan masalah termasuk halusinasi, lubang keamanan, dan perilaku yang tidak dapat diprediksi. Menurut penelitian perusahaan, model AI terkemuka seperti GPT-4 memiliki peluang 44% untuk menduplikasi konten berhak cipta saat diminta, dan bahkan model tingkat lanjut memiliki peluang lebih dari 20% untuk menghasilkan konten yang tidak aman dalam pengujian keamanan dasar.
Untuk membantu perusahaan meningkatkan keamanan sistem AI mereka, Patronus AI menyediakan serangkaian fitur inovatif. Diantaranya, fungsi "evaluator" yang paling signifikan memungkinkan perusahaan untuk menulis aturan evaluasi yang disesuaikan dalam bahasa Inggris sederhana. Fleksibilitas ini memungkinkan perusahaan di berbagai industri untuk menyesuaikan dengan kebutuhan mereka, mulai dari perusahaan jasa keuangan yang berfokus pada kepatuhan hingga organisasi layanan kesehatan yang berfokus pada privasi pasien dan keakuratan medis.
Inti dari platform ini adalah model deteksi halusinasi terobosan yang disebut Lynx, yang 8,3% lebih akurat dibandingkan GPT-4 dalam mengidentifikasi ketidakakuratan medis. Selain itu, platform ini memiliki dua mode pengoperasian: satu untuk pemantauan waktu nyata dan satu lagi untuk analisis mendalam. Selain pemeriksaan kesalahan tradisional, perusahaan juga telah mengembangkan alat khusus seperti CopyrightCatcher (alat pendeteksi hak cipta) dan FinanceBench (tolok ukur evaluasi kinerja keuangan) untuk memberikan perlindungan kesalahan AI yang komprehensif kepada perusahaan.
Agar alat keamanan ini terjangkau oleh lebih banyak perusahaan, Patronus AI mengadopsi model harga bayar sesuai pemakaian, mulai dari $10 per 1.000 panggilan API. Pengadopsi awal sudah mencakup perusahaan-perusahaan besar seperti HP, AngelList, dan Pearson, yang menunjukkan pentingnya investasi keamanan AI.
Saat ini, dengan pesatnya perkembangan AI, alat seperti platform Patronus AI tidak hanya dapat membantu perusahaan mengurangi risiko, namun juga membantu mematuhi undang-undang dan peraturan yang akan datang. Seiring dengan terus berkembangnya sistem AI, cara menangkap dan memperbaiki “ilusi” ini secara akurat akan menjadi tantangan penting bagi perusahaan.
Pintu masuk produk: https://www.patronus.ai/
Kemunculan Patronus AI memberikan cara berpikir baru untuk memecahkan masalah ilusi AI dan fungsi inovatifnya patut mendapat perhatian. Seiring dengan terus berkembangnya teknologi AI, alat keamanan AI serupa akan memainkan peran yang semakin penting, membantu perusahaan memanfaatkan teknologi AI dengan lebih baik sekaligus mengendalikan risiko secara efektif.