Artikel ini merangkum beberapa perkembangan penting terkini di bidang AI, khususnya di bidang pembuatan teks-ke-gambar. Perkembangan ini mencakup fusi model, pembuatan konsistensi gambar, dan peluncuran kerangka kerja sumber terbuka, yang mewakili tren terobosan dan inovasi teknologi berkelanjutan di bidang ini. Diantaranya, proyek LaVi-Bridge menyediakan metode fleksibel untuk menggabungkan berbagai bahasa dan model visual tanpa pelatihan; model ConsiStory memecahkan masalah konsistensi gambar dalam diagram Vincentian; versi Playground v2.5 telah mencapai hasil luar biasa dalam kualitas estetika dan potret detailnya Peningkatan yang signifikan; dan kerangka kerja sumber terbuka yang dirilis bersama oleh Universitas Peking, Stanford, dan PikaLabs telah melampaui kinerja model arus utama yang ada.
Proyek LaVi-Bridge adalah proyek yang menggabungkan berbagai model bahasa dan model visi generatif untuk mencapai pembuatan teks-ke-gambar tanpa pelatihan. LaVi-Bridge menggunakan LoRA dan adaptor untuk menyediakan pendekatan plug-and-play yang fleksibel dan kompatibel dengan berbagai bahasa dan model visual. ConsiStory adalah model grafik Vinsensian baru yang memecahkan tantangan konsistensi gambar dan menghasilkan gambar yang koheren tanpa pelatihan. Playground telah merilis versi v2.5, yang berfokus pada peningkatan kualitas estetika dan detail potret, dan kinerjanya melebihi model lainnya. Universitas Peking, Stanford, dan PikaLabs bersama-sama merilis kerangka grafik Vincent open source baru, yang memecahkan masalah grafik Vincent dan melampaui kinerja SDXL dan DALL·E3.Peluncuran proyek-proyek ini menunjukkan bahwa teknologi pembuatan teks-ke-gambar berkembang ke arah yang lebih efisien, nyaman, dan berkualitas tinggi, memberikan lebih banyak pilihan dan pengalaman lebih baik kepada pengguna, dan juga memberikan kemungkinan tak terbatas untuk aplikasi AI di masa depan. Saya yakin kita akan melihat lebih banyak inovasi serupa muncul dalam waktu dekat.