Bidang kecerdasan buatan terus berubah setiap harinya, dan penalaran kausal telah menjadi topik penelitian hangat dalam beberapa tahun terakhir. Model pembelajaran mesin tradisional sering kali gagal dalam penalaran logis dan sulit memahami hubungan sebab akibat di balik peristiwa. Hari ini, editor Downcodes akan memperkenalkan makalah penelitian dari institusi seperti Microsoft dan MIT, yang mengusulkan strategi pelatihan pembelajaran mesin terobosan yang secara signifikan meningkatkan kemampuan penalaran logis model besar, dan bahkan model Transformer kecil. Ini sebanding dengan GPT-. 4 dalam kemampuan penalaran. Mari kita lihat lebih dekat hasil penelitian yang mengesankan ini.
Di era ledakan informasi ini, kita berhadapan dengan perangkat pintar setiap hari. Pernahkah Anda bertanya-tanya bagaimana orang-orang yang kelihatannya pintar ini tahu untuk membawa payung saat hujan? Di balik hal ini sebenarnya terdapat revolusi besar dalam penalaran kausal.
Sekelompok peneliti dari institusi akademik ternama, termasuk Microsoft dan MIT, telah mengembangkan strategi pelatihan pembelajaran mesin yang inovatif. Strategi ini tidak hanya mengatasi kekurangan model pembelajaran mesin besar dalam penalaran logis, namun juga mencapai peningkatan yang signifikan melalui langkah-langkah berikut:
Metode pelatihan unik: Para peneliti menggunakan metode pelatihan baru yang mungkin berbeda dari teknik pelatihan pembelajaran mesin konvensional.
Peningkatan dalam penalaran logis: Pendekatan mereka secara signifikan meningkatkan kemampuan penalaran logis model besar, sehingga memecahkan tantangan yang ada sebelumnya.
Gunakan kausalitas untuk membangun kumpulan pelatihan: Tim peneliti menggunakan model kausalitas untuk membangun kumpulan data pelatihan. Model ini dapat mengungkap hubungan sebab akibat antar variabel dan membantu melatih model yang dapat memahami logika kausal di balik data.
Mengajarkan aksioma dasar model: Mereka secara langsung mengajarkan premis dasar dalam logika dan matematika kepada model untuk membantu model melakukan penalaran logis yang lebih baik.
Performa luar biasa dari model Transformer kecil: Meskipun parameter model hanya 67 juta, model Transformer yang dilatih melalui metode ini sebanding dengan GPT-4 dalam hal kemampuan penalaran.
Penalaran kausal mungkin terdengar seperti milik para filsuf, namun kenyataannya sudah merambah ke setiap aspek kehidupan kita. Untuk kecerdasan buatan, menguasai penalaran kausal seperti belajar menjelaskan dunia menggunakan "karena...jadi...". Namun AI tidak dilahirkan dengan hal ini, mereka perlu belajar, dan proses pembelajaran inilah yang menjadi inti dari makalah ini.
Metode pelatihan aksioma:
Bayangkan Anda memiliki seorang siswa yang sangat pintar tetapi tidak tahu sebab dan akibat di dunia ini. Bagaimana Anda mengajarkannya? Para peneliti menemukan solusi - pelatihan aksioma. Hal ini seperti memberi AI sebuah "panduan kausalitas" dan membiarkannya mempelajari cara mengidentifikasi dan menerapkan aturan sebab-akibat melalui manual ini.
Para peneliti melakukan eksperimen dengan model transformator dan menemukan bahwa metode pelatihan ini benar-benar berhasil! AI tidak hanya belajar mengidentifikasi hubungan sebab akibat pada grafik skala kecil, tetapi juga mampu menerapkan pengetahuan ini pada grafik yang lebih besar, meskipun demikian. Belum pernah ada gambaran sebesar ini sebelumnya.
Kontribusi penelitian ini adalah memberikan metode baru bagi AI untuk mempelajari inferensi kausal dari data pasif. Hal ini seperti memberi AI cara "berpikir" baru sehingga dapat memahami dan menjelaskan dunia dengan lebih baik.
Penelitian ini tidak hanya memungkinkan kita melihat kemungkinan AI mempelajari penalaran sebab akibat, namun juga membuka pintu bagi kita untuk melihat kemungkinan skenario penerapan AI di masa depan. Mungkin dalam waktu dekat, asisten cerdas kami tidak hanya dapat menjawab pertanyaan tetapi juga memberi tahu kami mengapa sesuatu terjadi.
Alamat makalah: https://arxiv.org/pdf/2407.07612v1
Secara keseluruhan, penelitian ini telah memberikan peningkatan yang signifikan terhadap kemampuan penalaran sebab akibat dari kecerdasan buatan dan memberikan arah serta kemungkinan baru untuk pengembangan AI di masa depan. Editor Downcodes menantikan penerapan teknologi ini di lebih banyak bidang, sehingga memungkinkan AI untuk lebih memahami dan melayani manusia.