Agen cerdas Agen Q yang baru-baru ini dirilis oleh MultiOn mengklaim telah mencapai tingkat keberhasilan yang menakjubkan sebesar 95,4% dalam tugas nyata, yang telah menarik perhatian luas di industri. CEO-nya sering menggunakan emotikon stroberi di Twitter, yang lebih mengingatkan pada proyek Q misterius OpenAI, sehingga memicu banyak spekulasi tentang teknologi di balik Agen Q. Agen Q menggabungkan teknologi seperti pencarian, refleksi diri, dan pembelajaran penguatan untuk merencanakan dan menyembuhkan diri sendiri, serta secara signifikan meningkatkan tingkat penyelesaian tugas melalui pengumpulan data otonom. Dalam tugas pemesanan Open Table yang sebenarnya, ini meningkatkan tingkat keberhasilan tanpa sampel LLaMa-3 dari 18,6% menjadi 81,7%, yang merupakan hal yang mengesankan.
Yang lebih mengejutkan lagi adalah CEO MultiOn Div Garg sering menggunakan emotikon stroberi di Twitter, yang mengingatkan orang akan proyek Q misterius OpenAI.
Netizen sangat penasaran dengan teknologi di balik Agen Q. Beberapa orang berspekulasi bahwa mungkin ada dukungan dari proyek Q* OpenAI di balik hal ini. MultiOn tidak hanya membuka akun Twitter independen untuk Agen Q, namun gambar latar belakang dan informasi dasar akun tersebut terkait dengan stroberi, yang tentunya menambah rasa penasaran masyarakat terhadap teknologi di baliknya.
Agen Q menggabungkan pembelajaran pencarian, refleksi diri, dan penguatan untuk memungkinkan perencanaan dan penyembuhan diri. Ini mengatasi keterbatasan teknik pelatihan LLM sebelumnya dengan memperkenalkan pembelajaran baru dan kerangka inferensi, memungkinkan navigasi halaman web otonom.
Dalam tugas simulasi toko online, Agen Q mendemonstrasikan kemampuan pencariannya yang canggih. Dalam tugas pemesanan Open Table yang sebenarnya, Agen Q meningkatkan tingkat keberhasilan tanpa sampel LLaMa-3 dari 18,6% menjadi 81,7%, dengan peningkatan skor sebesar 340%, dan hanya setelah satu hari pengumpulan data independen.
Meskipun Agen Q berkinerja baik dalam eksperimen evaluasi, masih banyak ruang untuk diskusi dan perbaikan dalam metode yang digunakan saat ini. Misalnya, desain algoritme inferensi, pemilihan strategi pencarian, serta keamanan dan interaksi online semuanya memerlukan penelitian dan pengoptimalan lebih lanjut.
Kemunculan Agen Q tidak diragukan lagi merupakan kemajuan besar di bidang agen AI, namun apakah ia bisa menjadi pemula di bidang AI atau hanya sekedar hype yang cerdik masih harus diuji oleh waktu. Bagaimanapun, peluncuran Agen Q membawa kemungkinan dan wahyu baru bagi pengembangan AI.
Referensi:
https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generasi-of-ai-agents-with-planning-and-self-healing-capabilities
Tingkat keberhasilan dan inovasi teknologi Agen Q sangat mengesankan, namun teknologi di baliknya masih memerlukan verifikasi dan peningkatan lebih lanjut. Di masa depan, agen AI seperti Agen Q akan berperan di lebih banyak bidang, mendorong pengembangan berkelanjutan teknologi kecerdasan buatan, dan memberikan lebih banyak kemudahan bagi kehidupan masyarakat.