Model pembuatan gambar Alibaba Qwen2vl-Flux adalah sumber terbuka dan mendukung penggabungan gambar, transfer gaya, dll.

Penulis：Eve Cole Waktu Pembaruan：2024-11-27 15:12:01

Alibaba telah membuat model pembuatan gambar terbarunya menjadi sumber terbuka, Qwen2vl-Flux. Model ini kuat dan mendukung berbagai operasi seperti pengeditan gambar, penggabungan, dan pencampuran, serta dapat menghasilkan gambar baru yang sangat mirip berdasarkan gambar atau teks yang disediakan oleh pengguna. Editor Downcodes akan membawa Anda mempelajari lebih lanjut tentang model AI yang menakjubkan ini dan melihat fungsi luar biasa yang dimilikinya. Ini tidak hanya dapat menghasilkan gambar multi-sudut dan multi-emosional berdasarkan satu gambar, tetapi juga secara cerdik mengintegrasikan gambar dan teks, dan bahkan mencapai perpaduan mulus antara gambar yang berbeda, seperti integrasi karakter atau transisi adegan. Yang lebih mengejutkan lagi adalah ia juga memiliki fungsi migrasi gaya grid, yang memungkinkan pengguna menyempurnakan gambar dan menghasilkan kreasi gambar yang lebih kreatif.

Baru-baru ini, Alibaba mengumumkan open source dari model pembuatan gambar yang baru dikembangkan Qwen2vl-Flux. Model ini tidak hanya memiliki banyak fungsi seperti pengeditan, penggabungan, dan pencampuran, tetapi juga dapat menghasilkan gambar baru yang sangat mirip saat pengguna memasukkan gambar atau teks. gambar.

Qwen2vl-Flux menyediakan fungsi pengubahan gambar yang kuat. Pengguna hanya perlu memasukkan gambar tanpa perintah teks apa pun, dan model dapat menghasilkan beberapa gambar serupa berdasarkan gambar aslinya. Misalnya, jika pengguna mengunggah foto karakter, model dapat menghasilkan representasi karakter dari berbagai sudut, yang menunjukkan perspektif dan emosi berbeda.

Model ini juga mendukung pencampuran gambar dengan panduan teks. Saat pengguna memasukkan gambar dan melampirkan perintah teks yang relevan, Qwen2vl-Flux dapat dengan cerdik mengintegrasikan gambar masukan dan konten teks untuk menciptakan efek gambar baru.

Selain fitur di atas, Qwen2vl-Flux juga memiliki kemampuan pencampuran gambar dengan panduan gambar. Pengguna dapat menggabungkan dua gambar berbeda untuk mencapai integrasi karakter atau transformasi adegan. Misalnya, menggabungkan karakter dengan latar belakang lain, model dapat memadukan keduanya dengan mulus untuk membentuk efek visual baru.

Fitur transfer gaya mesh pada model memberi pengguna kontrol mendetail atas gambar mereka. Pengguna dapat memodifikasi bagian tertentu dari gambar untuk mencapai kreasi yang lebih halus. Misalnya saja pada gambar yang menampilkan kombinasi teknologi tinggi dan lingkungan alam, pengguna dapat menambahkan detail teknologi bioluminescence atau efek kabut pagi di hutan untuk menampilkan pengalaman visual yang lebih kaya.

Pintu masuk proyek: https://huggingface.co/Djrango/Qwen2vl-Flux

Sumber terbuka Qwen2vl-Flux menghadirkan kemungkinan baru di bidang pembuatan gambar dan memberi pengembang alat yang canggih. Fungsinya yang beragam dan pengoperasiannya yang mudah menjadikannya sangat berharga dalam pengeditan dan pembuatan gambar. Patut dinantikan kemampuannya untuk menciptakan hasil yang lebih menakjubkan di masa depan!