Editor Downcodes mengetahui bahwa tim peneliti dari Universitas Stanford, Universitas Washington, dan Google DeepMind bersama-sama mengembangkan agen AI jenis baru yang dapat secara akurat mensimulasikan perilaku manusia dan mencapai hasil yang mengesankan dalam eksperimen sosial. Penelitian ini menyediakan alat laboratorium yang ampuh untuk menguji teori di bidang ilmu sosial seperti ekonomi, sosiologi, organisasi, dan ilmu politik, memberikan jalan baru untuk pemahaman yang lebih mendalam tentang perilaku manusia. Tim peneliti menggunakan data wawancara lebih dari 1.000 pemilih Amerika dan menggabungkannya dengan model GPT-4o untuk melatih agen AI yang dapat memulihkan reaksi manusia. Hasil dan data penelitian ini telah dipublikasikan ke publik, sehingga memberikan sumber daya berharga bagi para ilmuwan di seluruh dunia.
Baru-baru ini, tim peneliti dari Universitas Stanford, Universitas Washington, dan Google DeepMind mengembangkan agen kecerdasan buatan (AI) jenis baru yang dapat secara akurat mensimulasikan perilaku manusia dalam eksperimen sosial. Menurut penelitian mereka, teknik simulasi ini menjanjikan landasan laboratorium untuk pengujian teori di berbagai bidang seperti ekonomi, sosiologi, organisasi, dan ilmu politik.
Para peneliti membangun agen AI ini menggunakan data wawancara lebih dari 1.000 pemilih di AS. Usia, jenis kelamin, latar belakang pendidikan, dan pandangan politik orang-orang yang diwawancarai mewakili keragaman masyarakat Amerika. Agen AI menganalisis catatan wawancara ini dan menggunakan model GPT-4o untuk mereproduksi reaksi sebenarnya dari orang yang diwawancarai saat pengguna mengajukan pertanyaan.
Dalam hal implementasi spesifik, tim peneliti melakukan wawancara mendalam selama dua jam untuk setiap peserta dan menggunakan model Whisper OpenAI untuk mengubah konten wawancara menjadi teks. Metode ini sangat meningkatkan akurasi agen AI. Dalam uji prediksi perilaku manusia, agen AI berdasarkan data wawancara berhasil memprediksi respons manusia terhadap survei sosial umum dengan akurasi 85%, jauh lebih baik dibandingkan agen AI yang hanya mengandalkan informasi demografi dasar.
Para peneliti juga melakukan lima eksperimen ilmu sosial, dan hasilnya menunjukkan bahwa dalam empat eksperimen, hasil yang dihasilkan oleh agen AI sangat konsisten dengan respons partisipan manusia, dengan koefisien korelasi sebesar 0,98. Hal ini menunjukkan bahwa metode berbasis wawancara menunjukkan akurasi yang lebih baik dan keseimbangan yang lebih baik dalam analisis tanggapan dari ideologi politik dan kelompok etnis yang berbeda.
Untuk memfasilitasi penelitian lanjutan, tim peneliti mengunggah kumpulan data 1.000 agen AI yang dibuatnya ke GitHub untuk digunakan oleh ilmuwan lain. Untuk melindungi privasi peserta, tim mengadopsi sistem akses dua tingkat.
Para ilmuwan memiliki akses bebas terhadap data respons agregat untuk tugas-tugas tertentu, sedangkan akses terhadap data respons individual dalam studi terbuka memerlukan izin khusus. Sistem ini dirancang untuk membantu peneliti mempelajari perilaku manusia dengan lebih baik sekaligus melindungi privasi peserta wawancara asli.
Pintu masuk proyek: https://github.com/joonspk-research/genagents
Signifikansi terobosan penelitian ini terletak pada keakuratannya dalam mensimulasikan perilaku manusia dan potensi kontribusinya terhadap penelitian ilmu sosial. Dengan membuat kumpulan data tersedia untuk umum, penelitian ini diharapkan dapat mendorong lebih banyak penelitian mengenai perilaku manusia dan fenomena sosial, memberikan perspektif baru untuk memahami dan memprediksi perkembangan sosial dengan lebih akurat. Editor Downcodes menantikan teknologi ini memberikan hasil yang lebih mengejutkan di masa depan.