Tim peneliti Institut Kecerdasan Buatan Beijing telah merilis model pembuatan gambar baru OmniGen, yang mendobrak batasan fungsi tunggal alat pembuatan gambar tradisional. Berbeda dari model seperti Difusi Stabil, OmniGen mengintegrasikan berbagai fungsi seperti pembuatan teks ke gambar dan pengeditan gambar dalam kerangka terpadu, menjadikannya "serbaguna". Editor Downcodes akan menjelaskan secara detail kekuatan OmniGen dan prospek penerapannya.
Baru-baru ini, tim peneliti Institut Kecerdasan Buatan Beijing meluncurkan model pembuatan gambar baru yang disebut OmniGen.
Pemutar gambar dan pengeditan serba bisa
Dibandingkan dengan alat penghasil gambar sebelumnya seperti Difusi Stabil, keunggulan terbesar OmniGen adalah alat ini tidak lagi hanya berfokus pada satu tugas, namun memiliki banyak kemampuan:
Ini dapat menangani berbagai tugas pembuatan gambar dalam kerangka terpadu: dari pembuatan teks hingga pembuatan gambar dan pengeditan gambar.
Artinya, pengguna hanya perlu memberikan kata-kata cepat sederhana untuk mengontrol pembuatan gambar dan pengeditan halus, dan tidak perlu lagi menggunakan plug-in seperti ControlNet dan IP-Adapter untuk menyesuaikan detail gambar!
Disini AIbase didasarkan pada pemberian kata prompt efek detail untuk fotografi kreatif dengan kamera jadul. Keseluruhan efek yang dihasilkan penuh dengan detail dan efeknya adalah sebagai berikut:
Dalam beberapa pengujian, OmniGen berkinerja mengesankan, setara dengan model tercanggih di pasar untuk pembuatan teks-ke-gambar. Pada benchmark GenEval, OmniGen hanya menggunakan 0,1 miliar gambar untuk pelatihan, sementara SD3 menggunakan lebih dari 1 miliar gambar.
Kemampuan mengedit gambar juga luar biasa, dengan kemampuan mengontrol gambar sumber dan instruksi pengeditan secara akurat. Misalnya, pada set pengujian EMU-Edit, model ini melampaui model terkenal seperti InstructPix2Pix, dan bahkan sebanding dengan model EMU-Edit yang canggih saat ini.
Dalam tugas generasi berbasis subjek, OmniGen telah menunjukkan kemampuan personalisasi yang luar biasa dan cocok untuk berbagai bidang seperti kreasi seni dan desain periklanan.
Alamat uji coba: https://huggingface.co/spaces/Shitao/OmniGen
Makalah: https://arxiv.org/html/2409.11340v1
OmniGen menghadirkan terobosan baru dalam bidang pembuatan gambar dengan fungsinya yang kuat dan kinerja yang efisien. Metode pengoperasiannya yang sederhana dan mudah digunakan juga menurunkan ambang batas pembuatan gambar dan menyediakan alat kreatif yang nyaman bagi lebih banyak pengguna. OmniGen diharapkan memiliki aplikasi yang lebih luas di masa depan dan mendorong pengembangan lebih lanjut teknologi pembangkitan gambar kecerdasan buatan.