Semua aktivitas sehari-hari di dunia manusia direproduksi 1:1 di "Minecraft". Peradaban yang terdiri dari 100 miliar agen AI sebenarnya terlihat seperti ini.
“Peradaban cerdas AI” pertama di dunia akhirnya terungkap!
2 bulan yang lalu, lebih dari 1.000 agen berkolaborasi di dunia maya untuk membangun ekonomi, budaya, agama, dan pemerintahan mereka sendiri...
Netizen berseru bahwa ini bisa disebut sebagai "Dunia Barat" versi kehidupan nyata.
Kini, peradaban ini telah berevolusi lagi. Seperti apa dunia dengan peradaban 100 miliar agen AI?
Mereka adalah individu dan kelompok.
Semua aktivitas dalam kehidupan sehari-hari manusia akan direplikasi 1:1 di "Minecraft".
RoBERT Yang, alumnus Universitas Peking, berbagi penelitian terbaru tim dan untuk pertama kalinya memperkenalkan “arsitektur kognitif” baru di balik PIANO.
PIANO (Parallel Information Aggregation Neural Coordinate) adalah arsitektur yang memungkinkan agen AI berinteraksi dengan banyak pihak sambil menjaga koherensi dalam berbagai aliran keluaran.
Alamat proyek: https://github.com/altera-al/project-sid
Bagaimana agen AI dapat berpikir dan bertindak secara bersamaan, dalam berbagai skala waktu, beroperasi secara sadar dan tidak sadar?
Sama seperti tuts piano, mereka mewakili modul otak yang berbeda. Jika dimainkan bersama-sama, dapat menghasilkan akord yang indah. Pada agen cerdas, kualitas mirip manusia juga dihasilkan.
Agen-agen cerdas ini akan membangun sebuah “peradaban”. Perpajakan, perdagangan, pemerintahan, negara, agama...semua aktivitas sehari-hari di dunia manusia juga termasuk dalam agen AI.
Selain itu, agen AI dapat secara akurat menyimpulkan emosi orang lain, menjalin persahabatan, dan bahkan membuat musuh. Beberapa agen introvert, seperti manusia sosiofobia, memiliki koneksi sosial yang lebih sedikit dibandingkan agen ekstrovert.
Beberapa netizen mengatakan bahwa kita hidup dalam matriks simulasi dan masa depan adalah sekarang.
Selanjutnya, mari kita lihat “dunia” agen AI.
Mengapa peradaban cerdas AI dibutuhkan?
Agar agen AI dapat hidup berdampingan dengan manusia dan berintegrasi ke dalam masyarakat kita, mereka tidak hanya harus mandiri tetapi juga mampu berkolaborasi.
Dalam beberapa tahun terakhir, kemajuan dalam model bahasa besar (LLM) untuk penalaran dan pengambilan keputusan telah meningkatkan otonomi agen secara signifikan.
Namun, memiliki otonomi saja tidak cukup. Agen juga harus hidup berdampingan dengan manusia dan agen lain dalam peradaban manusia.
Seperti yang dikatakan penulis makalah ini:
Mengukur kemajuan peradaban berdasarkan kemampuan agen untuk hidup berdampingan dan memajukan peradaban non-manusia merupakan tolok ukur utama kemampuan agen kecerdasan buatan.
Namun membangun peradaban AI tidaklah mudah.
Pertama, agen berbasis LLM sering mengalami kesulitan mempertahankan realitas dalam tindakan dan penalaran mereka.
Bahkan ketika dilengkapi dengan modul untuk perencanaan dan refleksi, agen sering kali terjebak dalam pola perilaku berulang atau menumpuk kesalahan melalui halusinasi, sehingga menghambat kemajuan yang berarti.
Kedua, agen yang salah mengkomunikasikan pikiran dan niatnya dapat menyesatkan agen lain, sehingga menyebabkan halusinasi dan putaran lebih lanjut. Miskomunikasi ini sering terjadi pada kelompok agen sehingga menimbulkan perilaku disfungsional dan memperburuk kinerja individu dalam kelompok.
Terakhir, tolok ukur agen saat ini berfokus pada kinerja agen otonom di berbagai domain, seperti penelusuran web, pemrograman, penelusuran dan kueri, serta penalaran.
Jadi, apa solusi optimal untuk membangun agen AI?
Arsitektur PIANO baru
Untuk mengatasi masalah yang ada, muncullah arsitektur PIANO baru.
Arsitektur PIANO adalah kerangka desain agen cerdas yang komprehensif dan sangat fleksibel.
Diantaranya, P mewakili modul persepsi, I mewakili inti cerdas, dan A adalah modul tindakan. Salah satu fitur paling mencolok dari arsitektur PIANO adalah memungkinkan agen untuk berpikir dan bertindak secara bersamaan.
Fitur ini mendobrak batasan-batasan yang saling membatasi antara tindakan dan pemikiran yang mungkin ada dalam arsitektur tradisional.
Dalam lingkungan yang kompleks dan selalu berubah, agen menghadapi berbagai situasi, termasuk ancaman langsung yang memerlukan respons cepat, serta perencanaan jangka panjang yang matang.
Dalam hal koherensi perilaku, modul pengontrol kognitif (CC) diperkenalkan.
Modul pengontrol kognitif (CC) seperti "pusat otak" dari agen cerdas, yang bertanggung jawab untuk membuat keputusan tingkat tinggi - dengan menerima dan mensintesis informasi dari setiap modul, pengontrol kognitif mengubah informasi ini menjadi keputusan yang terpadu dan terkoordinasi. dan selanjutnya mengubahnya menjadi output yang sesuai di setiap modul motor.
Hal ini memastikan kolaborasi yang harmonis antara berbagai modul dan menghindari inkonsistensi yang disebabkan oleh modul berbeda yang bekerja secara independen.
Berdasarkan dua prinsip arsitektur di atas, sistem arsitektur PIANO terdiri dari 10 modul berbeda yang berjalan secara bersamaan. Modul intinya meliputi:
-ingatan:
Modul memori dapat disebut sebagai "perbendaharaan kebijaksanaan" agen. Baik itu sapaan singkat setiap hari, diskusi teknis yang mendalam, atau komunikasi emosional, setiap kata dan setiap perubahan nada disimpan secara akurat.
Selain itu, agen tidak hanya dapat mengingat uraian setiap langkah, tetapi juga pertanyaan yang diajukan dalam percakapan, urutan jawaban, dan poin-poin penting yang ditekankan oleh kedua belah pihak.
-Kesadaran tindakan:
Ini seperti sistem pemeriksaan fisik yang komprehensif. Melalui modul ini, agen dapat secara akurat memahami cadangan energinya sendiri dan mengetahui berapa lama sisa daya dapat mendukung operasi, atau apakah cadangan bahan bakar cukup untuk menyelesaikan tugas tahap berikutnya.
Pada saat yang sama, ia dapat memantau berbagai komponen secara real time, seperti mendeteksi apakah sensor berfungsi dengan baik, fleksibilitas sambungan mekanis, kecepatan komputasi unit pemrosesan data, dll. Tidak ada kelainan kecil yang bisa lolos dari “matanya”.
-Pembuatan target:
Hal ini didasarkan pada pengalaman agen yang kaya dan interaksi mendalam dengan lingkungan, terus-menerus memupuk tujuan baru dan mendorong agen maju.
Misalnya, dalam skenario logistik kerjasama multi-agen, agen menemukan bahwa kemacetan sering terjadi di suatu area tertentu selama pengangkutan kargo (interaksi lingkungan), dan sebelumnya telah berpartisipasi dalam optimalisasi rute transportasi (pengalaman masa lalu), maka tujuannya adalah dihasilkan Modul ini mungkin menghasilkan tujuan baru: berkolaborasi dengan agen lain untuk merancang skema rute transportasi baru yang menghindari kemacetan.
Mekanisme pembangkitan tujuan ini memberikan agen kemampuan untuk secara aktif bereksplorasi dan berinovasi, sehingga tidak hanya secara pasif melakukan tugas-tugas yang telah ditetapkan, tetapi juga secara aktif memperluas bidang tindakannya sesuai dengan situasi sebenarnya.
-Kesadaran sosial:
Ini membuka pintu bagi agen cerdas untuk memahami dan berintegrasi ke dalam kelompok.
Mudah dimengerti, ia dapat merespons dengan cepat informasi tindakan tertentu.
Misalnya, isyarat sederhana (mengangkat tangan mungkin berarti meminta bantuan atau menarik perhatian), atau postur tubuh tertentu (mencondongkan tubuh sedikit ke depan mungkin menunjukkan keramahan dan perhatian), modul kesadaran sosial dapat mengenali dan memahami maknanya secara akurat.
Tentu saja, jika ia mengenali sinyal bantuan dari agen lain, ia dapat memutuskan apakah akan memberikan bantuan berdasarkan kemampuannya sendiri dan situasi tugas saat ini.
-dialog:
Modul dialog adalah "pusat bahasa" dari agen cerdas dan kunci komunikasi efektif dengan dunia luar.
Modul dialog memiliki analisis sintaksis dan kemampuan pemahaman semantik yang kuat. Ia dapat secara akurat mengurai semua jenis masukan bahasa yang diterimanya, baik itu instruksi yang ringkas dan jelas, ekspresi emosional, atau deskripsi konseptual yang kompleks dan abstrak.
Selain itu, untuk bahasa yang samar-samar atau ambigu, ia juga dapat membuat kesimpulan yang masuk akal berdasarkan konteks dan kebiasaan berbahasa.
Dalam hal pembangkitan bahasa, modul dialog dapat mengungkapkan pemikirannya secara akurat berdasarkan keadaan internal dan niat agen.
-Eksekusi keterampilan:
Modul eksekusi keterampilan adalah pelaksana langsung interaksi antara agen cerdas dan lingkungan eksternal. Ketika agen perlu melakukan keterampilan atau tindakan tertentu di lingkungan, modul eksekusi keterampilan mengoordinasikan bagian-bagian terkait secara tertib.
Evolusi agen tunggal-multi-agen
Mengambil "Minecraft" sebagai contoh, para peneliti memilih 1.000 item untuk dievaluasi dalam upaya mengamati dan mengukur kemajuan peradaban cerdas.
agen tunggal
Pertama, kinerja agen dievaluasi berdasarkan cara ia memperoleh item di Minecraft.
Para peneliti menyiapkan 25 agen. Ransel mereka pada awalnya kosong, dan tempat kelahiran mereka jauh dan mereka tidak dapat berkomunikasi satu sama lain. Agen-agen ini siap untuk menjelajahi dan mengumpulkan barang-barang.
Mereka dilahirkan di tempat yang berbeda, seperti permukaan, gua, hutan, atau lingkungan berbeda lainnya. Titik spawn yang berbeda berarti mereka memiliki sumber daya yang berbeda, dan kesulitan menyelesaikan tujuan mengumpulkan item juga berbeda.
Misalnya, agen yang lahir di permukaan yang terdapat banyak sumber daya mungkin memiliki banyak bahan dasar seperti kayu dan batu di sekitarnya, yang dapat dengan mudah digunakan untuk membuat perkakas dasar; mineral, tetapi ada juga kegelapan, monster, dll. Berbahaya, dan Anda harus menjelajah ke luar untuk mendapatkan lebih banyak jenis barang.
Peneliti menemukan bahwa setelah bermain selama 30 menit dengan agen dengan arsitektur PIANO lengkap, rata-rata dapat diperoleh 17 item berbeda. Namun, performanya sangat bervariasi, terutama karena perbedaan posisi lahir.
Beberapa agen hanya bisa mendapatkan kurang dari 5 item, sedangkan agen dengan performa terbaik bisa mendapatkan 30-40 item, yang hampir sama dengan pemain manusia yang memiliki beberapa pengalaman di "Minecraft".
Jadi, apa batas atas pengembangan agen tunggal?
Para peneliti menemukan bahwa dalam kondisi yang sama, mereka menambah jumlah agen menjadi 49 dan membiarkan mereka bermain selama empat jam. Setelah banyak percobaan, ditemukan bahwa jumlah item berbeda yang dikumpulkan oleh semua agen telah stabil pada sepertiga dari semua item di "Minecraft" (sekitar 320 item).
multi-agen
Multi-agen, seperti namanya, adalah sekelompok beberapa agen yang dapat berkomunikasi atau bersaing satu sama lain dalam lingkungan yang sama.
Kelompok kecil:
Agar agen dapat bekerja sama dan berkembang dalam suatu kelompok, mereka harus mampu memahami tindakan dan pemikiran agen lainnya. Kemampuan memahami baik diri sendiri maupun orang lain memungkinkan agen untuk menyesuaikan perilakunya sesuai dengan situasi dalam lingkungan sosial .
Misalnya, membangun kepercayaan ketika bekerja dengan sekutu, dan menghadapi persaingan dan konflik ketika bergaul dengan lawan. Para peneliti menemukan melalui eksperimen bahwa agen tidak hanya mampu secara sosial tetapi juga dapat membentuk hubungan sosial yang bermakna dalam simulasi skala besar yang melibatkan hingga 50 agen.
Para peneliti terutama mempelajari peran dan kesadaran agen dalam kelompok melalui dua rangkaian eksperimen.
-Dapatkah agen yang memiliki kesadaran sosial menyimpulkan emosi orang lain melalui obrolan?
Pada percobaan chat antara tiga karakter dan agen di "Minecraft", terlihat bahwa ketika karakter dalam game tersebut mengekspresikan perubahan emosi seperti cinta-marah-cinta, agen mampu sepenuhnya memahami perubahan emosi tersebut dan membuat React. demikian.
-Dapatkah agen merasakan emosi dan bertindak sesuai dengan itu?
Dalam eksperimen lain, perilaku seorang agen disimpulkan dari seberapa besar karakter dalam game menyukai atau tidak menyukai agen yang sama. Para peneliti menemukan bahwa agen tidak hanya secara akurat menyimpulkan maksud dari karakter dalam game, tetapi juga menggunakan niat untuk mewujudkannya keputusan sendiri ketika mengambil tindakan.
masyarakat:
Selanjutnya, para peneliti menempatkan 50 agen dalam peta "Minecraft" yang dibuat secara acak dan memberi setiap agen kepribadian yang unik. Mereka dapat bergerak bebas di dunia ini dan berkomunikasi dengan agen lain sesuka hati.
Dalam skenario bebas ini, para peneliti menemukan bahwa agen tidak hanya dapat menilai peran agen lain secara akurat, namun semakin banyak agen yang terlibat dalam penilaian dan semakin lama mereka berkomunikasi, semakin akurat penilaian tersebut.
Selain itu, dalam percobaan ini peneliti juga menemukan beberapa fenomena penting:
-Pentingnya modul sosial:
Jika modul sosial dihilangkan, maka hubungan antar agen saat ini akan relatif datar, yang menunjukkan bahwa modul sosial sangat penting untuk berkembangnya hubungan jangka panjang (baik ke arah baik atau buruk).
-Dampak kepribadian di jejaring sosial:
Para peneliti menemukan bahwa beberapa agen memiliki pola hubungan sosial yang berbeda berdasarkan kepribadian mereka.
Misalnya, agen introvert menerima koneksi yang jauh lebih sedikit dibandingkan agen sosial ekstrover, yang menunjukkan bahwa kepribadian juga dapat tercermin dalam jaringan sosial yang besar dan kompleks.
Dan, meskipun emosinya sering kali saling menguntungkan, tidak selalu seperti itu. Seorang agen mungkin memiliki pendapat yang baik terhadap agen lain namun mengabaikannya, seperti situasi di dunia nyata di mana hubungan antarpribadi bersifat kompleks dan tidak selalu saling menguntungkan.
Peradaban lahir
Setelah evolusi dari agen tunggal menjadi agen multi, langkah selanjutnya adalah lahirnya peradaban.
Untuk menilai kemampuan para agen dalam memajukan peradaban, para peneliti mengevaluasi bagaimana mereka berperilaku dalam beberapa situasi:
– Perilaku agen berdasarkan aturan kolektif (berfokus pada kepatuhan dan revisi undang-undang perpajakan)
– Jelajahi komunikasi budaya melalui pembuatan meme secara spontan dan komunikasi terstruktur dari satu agama
Masing-masing melaksanakan tugasnya dan berspesialisasi dalam pembagian kerja
Pembagian kerja khusus manusialah yang mendorong kemajuan peradaban dan mendorong kemajuan pertanian, pemerintahan, kebudayaan, dan teknologi. Untuk meniru kualitas-kualitas peradaban yang muncul ini, para agen juga harus memilikinya.
Untuk tujuan ini, penulis mengusulkan tiga standar dasar untuk spesialisasi agen:
Pertama, memiliki otonomi dalam pemilihan dan transisi peran. Kedua, spesialisasi mereka harus ditunjukkan melalui interaksi dan pengalaman, tanpa arah dan batasan yang jelas. Terakhir, peran yang mereka pilih harus tercermin dalam perilaku yang konsisten dengan profesinya.
Seperti terlihat pada gambar di bawah, peneliti menempatkan agen cerdas di suatu desa, dan mereka akan mengembangkan sendiri berbagai profesi, seperti petani dan insinyur.
Menghapus kesadaran sosial menyebabkan agen memilih peran yang lebih homogen dan tidak bertahan lama.
Berikut simulasi distribusi perilaku 30 agen di suatu desa.
Mematuhi undang-undang perpajakan, mengubah undang-undang
Bisakah agen AI membuat dan mengubah undang-undang mereka sendiri?
Selanjutnya peneliti menguji agen tersebut dengan menerapkan sistem perpajakan. Ditemukan bahwa mereka tidak hanya mematuhi undang-undang perpajakan tetapi juga secara demokratis memilih untuk mengubah tarif pajak berdasarkan sentimen publik.
Penyebaran agama bervariasi dari kota ke kota
Terakhir, bisakah agen AI mengembangkan budaya mereka sendiri?
Para peneliti mengamati secara khusus penyebaran meme secara organik dan melacak bagaimana agen membentuk agama fiksi dan menyebar melalui asosiasi agen.
Menariknya lagi, pedesaan dan perkotaan menghadirkan pola budaya yang berbeda.
Alumni Universitas Peking memulai bisnis untuk membangun AI yang berempati
Alasan diluncurkannya Project Sid adalah karena tim Altera AI berharap dengan mengeksplorasi permasalahan ini, manusia digital pada akhirnya dapat terintegrasi dengan mulus ke dalam masyarakat manusia.
Robert Yang adalah salah satu pendiri dan CEO Altera.
Sebelumnya, ia menerima gelar PhD di bidang ilmu saraf komputasi dari Universitas New York dan Universitas Yale, serta gelar sarjana fisika dari Universitas Peking.
Dia adalah seorang profesor di Departemen Ilmu Otak dan Kognitif dan Departemen Teknik Elektro dan Ilmu Komputer di MIT, dan pemimpin kelompok MetaConscious MIT.
Pada tahun 2023, dia menutup labnya dan meninggalkan posisinya di MIT untuk mendirikan Altera.
Meskipun tim Altera kecil, kepadatan bakatnya sangat tinggi——
Ini terdiri dari ahli saraf komputasi, atlet Olimpiade fisika, dan insinyur dari Departemen Teknik Elektro dan Ilmu Komputer MIT, Grup Pemrosesan Bahasa Alami Stanford, Google X, Citadel, Supercell, dan banyak lagi.
Perusahaan yang didirikan lebih dari setengah tahun lalu ini menerima pendanaan awal sebesar US$2 juta di awal tahun, dipimpin oleh Andreessen Horowitz.
Tiga bulan kemudian, mereka mengumpulkan $9 juta lagi, dipimpin oleh First Spark Ventures milik mantan CEO Google Eric Schmidt, Patron VC, angel investor Mitch Lasky, dan lainnya.
Pada bulan Mei tahun ini, Altera membuka cabang di Menlo Park dan berkomitmen menjadi pemasok pertama produk konsumen pintar.