Dalam beberapa tahun terakhir, mekanisme pembelajaran model kecerdasan buatan telah menjadi topik penelitian yang hangat. Artikel ini memperkenalkan studi terbaru yang mengungkap kemampuan tersembunyi model AI dengan menganalisis dinamika pembelajaran model AI di "ruang konsep" dan cara menggunakan teknologi tertentu untuk merangsang kemampuan ini agar lebih memahami dan menghasilkan gambar. Hasil penelitian menemukan bahwa proses pembelajaran model tidak berkembang secara linier, melainkan terdapat liku-liku mendadak dan pengaktifan kemampuan-kemampuan yang terpendam. Penelitian ini tidak hanya memperdalam pemahaman kita tentang mekanisme pembelajaran model AI, namun juga memberikan ide-ide baru untuk mengembangkan sistem AI yang lebih kuat.
Baru-baru ini, sebuah metode penelitian baru mengungkapkan potensi kemampuan model AI dalam proses pembelajaran, melebihi ekspektasi masyarakat sebelumnya. Dengan menganalisis dinamika pembelajaran model AI di “ruang konsep”, para peneliti menemukan bagaimana membuat sistem AI lebih memahami dan menghasilkan gambar.
Catatan sumber gambar: Gambar dihasilkan oleh AI, dan penyedia layanan otorisasi gambar Midjourney
“Konsep ruang” adalah sistem koordinat abstrak yang dapat mewakili karakteristik setiap konsep independen dalam data pelatihan, seperti bentuk, warna, atau ukuran suatu objek. Para peneliti mengatakan bahwa dengan menggambarkan dinamika pembelajaran di ruang ini, dapat diketahui bahwa kecepatan pembelajaran konsep dan urutan pembelajaran dipengaruhi oleh atribut data yang disebut dengan “sinyal konsep”. Sinyal konsep ini mencerminkan sensitivitas proses pembuatan data terhadap perubahan nilai konsep. Misalnya, suatu model mempelajari warna lebih cepat ketika perbedaan antara merah dan biru terlihat jelas dalam kumpulan data.
Selama proses penelitian, tim peneliti mengamati bahwa dinamika pembelajaran model akan mengalami perubahan arah secara tiba-tiba, dari “memori konsep” menjadi “generalisasi”. Untuk memverifikasi fenomena ini, mereka melatih model dengan "lingkaran merah besar", "lingkaran biru besar", dan "lingkaran merah kecil" sebagai masukan. Model tidak dapat menghasilkan kombinasi "lingkaran biru kecil" yang tidak muncul dalam pelatihan melalui perintah teks sederhana. Namun, dengan menggunakan teknik "intervensi potensial" (yaitu memanipulasi aktivasi yang bertanggung jawab atas warna dan ukuran model) dan teknik "over-cueing" (yaitu meningkatkan spesifikasi warna melalui nilai RGB), para peneliti berhasil menghasilkan "lingkaran biru kecil". " Hal ini menunjukkan bahwa meskipun model mampu memahami kombinasi "biru" dan "kecil", model tidak menguasai kemampuan tersebut melalui perintah teks sederhana.
Para peneliti juga memperluas metode ini ke kumpulan data dunia nyata, seperti CelebA, yang berisi beberapa atribut gambar wajah seperti jenis kelamin dan senyuman. Hasilnya menunjukkan bahwa model tersebut menunjukkan kemampuan bersembunyi ketika menghasilkan gambar wanita yang tersenyum, namun lemah ketika menggunakan isyarat dasar. Selain itu, eksperimen awal juga menemukan bahwa saat menggunakan Stable Diffusion1.4, over-prompting dapat menghasilkan gambar yang tidak biasa, seperti kartu kredit berbentuk segitiga.
Oleh karena itu, tim peneliti mengajukan hipotesis umum tentang kemampuan tersembunyi: Model generatif memiliki kemampuan laten yang muncul secara tiba-tiba dan konsisten selama pelatihan, meskipun model mungkin tidak menunjukkan kemampuan tersebut ketika dihadapkan pada isyarat biasa.
Menyorot:
Model AI menunjukkan kemampuan laten yang tersembunyi selama pembelajaran di luar apa yang dapat diperoleh dari isyarat konvensional.
Melalui teknik seperti "intervensi laten" dan "prompting berlebihan", peneliti dapat mengaktifkan kemampuan tersembunyi ini dan menghasilkan gambaran yang tidak terduga.
Studi ini menganalisis dinamika pembelajaran "ruang konsep" dan menunjukkan bahwa kecepatan pembelajaran berbagai konsep dipengaruhi oleh karakteristik data.
Penelitian ini memberikan perspektif baru bagi kita untuk memahami mekanisme pembelajaran model AI, dan juga memberikan referensi berharga untuk pengembangan dan penerapan model AI di masa depan. Metode analisis "ruang konsep" dan teknologi "intervensi potensial" dan "over-prompt" memberikan alat yang efektif untuk memanfaatkan potensi kemampuan model AI dan layak untuk penelitian dan penerapan lebih lanjut.