Tim peneliti Google telah merilis Alchemist, sebuah terobosan teknologi pengeditan gambar yang memungkinkan pengguna mengontrol secara tepat sifat material objek dalam gambar, seperti warna, kilau, dan transparansi, tanpa memerlukan perangkat lunak atau keterampilan profesional. Pada intinya, Alchemist adalah model pembuatan teks-ke-gambar yang disempurnakan yang mencapai kontrol yang baik atas parameter material dengan mensintesis kumpulan data dan memodifikasi arsitektur model Stable Diffusion 1.5. Teknologi ini berpotensi merevolusi proses pengeditan gambar, menyediakan alat canggih bagi para profesional seperti desainer, seniman, dan arsitek.
Tim peneliti Google baru-baru ini meluncurkan teknologi terobosan - Alchemist. Teknologi ini memungkinkan pengguna mengedit secara tepat properti material item dalam gambar, seperti warna, kilau, dan transparansi, tanpa memerlukan perangkat lunak dan keterampilan pengeditan gambar profesional.
Inti dari teknologi Alchemist adalah model generasi Text-to-Image (T2I) yang telah disempurnakan. Tim peneliti mencapai kontrol yang baik atas parameter material dengan membuat kumpulan data sintetis dan memodifikasi arsitektur model Stable Diffusion1.5.
Secara khusus, para peneliti pertama kali menghasilkan sejumlah besar gambar sintetis menggunakan grafik komputer dan teknik rendering berbasis fisik. Gambar-gambar ini berisi berbagai model 3D dengan bahan, sudut kamera, dan kondisi pencahayaan yang dipilih secara acak. Mereka kemudian membuat perubahan pada satu atribut dari gambar-gambar ini, menghasilkan beberapa versi dengan kekuatan pengeditan yang berbeda-beda.
Dengan menyempurnakan data sintetik ini, model mempelajari cara mengubah hanya properti material tertentu, gambar konteks tertentu, instruksi, dan nilai intensitas edit, sekaligus menjaga bentuk item dan pencahayaan gambar tidak berubah.
Hasil eksperimen menunjukkan bahwa teknologi ini dapat secara efektif mengubah tampilan objek, seperti meningkatkan kesan metalik atau menyesuaikan transparansi. Dalam studi pengguna, pendekatan ini mencapai keuntungan yang signifikan baik dalam fotorealisme maupun preferensi pengguna dibandingkan dengan pendekatan dasar.
Prospek penerapan teknologi ini luas. Ini dapat membantu desainer interior melihat bagaimana ruangan akan terlihat ketika dicat ulang, atau membantu arsitek, seniman, dan desainer dengan cepat membuat sketsa desain untuk produk baru. Selain itu, karena efek pengeditannya konsisten secara visual, teknologi ini juga dapat digunakan untuk tugas 3D hilir seperti rekonstruksi NeRF (Neural Radiation Field).
Meskipun teknologi Alchemist telah membuat kemajuan signifikan dalam pengeditan materi, tim peneliti juga menunjukkan beberapa keterbatasan. Misalnya, model ini masih memiliki ruang untuk perbaikan dalam menangani detail tersembunyi dalam gambar.
Namun, para peneliti yakin dengan potensi teknologi untuk mengedit materi secara terkendali. Dengan penelitian dan optimasi lebih lanjut, Alchemist diharapkan dapat merevolusi bidang pengeditan gambar, menjadikan tugas pengeditan material yang kompleks menjadi lebih sederhana dan intuitif.
Teknologi Alchemist Google mewakili terobosan besar lainnya dalam kecerdasan buatan di bidang pemrosesan gambar. Hal ini tidak hanya menyederhanakan proses pengeditan gambar yang kompleks, tetapi juga memberikan kemungkinan baru bagi industri kreatif dan diharapkan memberikan dampak besar di berbagai bidang seperti desain, seni, dan realitas virtual.
Alamat proyek: https://prafullsharma.net/alchemist/
Munculnya teknologi Alchemist menandai tonggak sejarah lain di bidang kecerdasan buatan dalam pengeditan gambar. Kemampuan pengeditan materinya yang efisien dan akurat pasti akan membawa vitalitas baru bagi industri kreatif dan mendorong pengembangan berkelanjutan dan inovasi teknologi terkait.