Baru-baru ini, tim peneliti dari Universitas New York, MIT, dan Google menerbitkan studi terobosan, mengusulkan kerangka kerja inovatif yang dirancang untuk memecahkan masalah kemacetan waktu inferensi pada model difusi. Kerangka kerja ini secara cerdik menggabungkan umpan balik validator dan algoritme pencarian kandidat yang berisik untuk meningkatkan kinerja model generatif secara signifikan dengan memperkenalkan sumber daya komputasi tambahan sambil mempertahankan sejumlah langkah denoising yang tetap. Penelitian ini tidak hanya mencapai hasil luar biasa dalam beberapa pengujian benchmark, namun juga memberikan referensi berharga untuk pengembangan sistem verifikasi yang lebih terspesialisasi di masa depan untuk tugas pembuatan visual.
Kerangka kerja ini terutama diterapkan dengan memperkenalkan validator untuk memberikan umpan balik, dan menerapkan algoritma untuk menemukan kandidat noise yang lebih baik. Tim peneliti menggunakan Inception Score dan Fréchet Inception Distance sebagai validator dan melakukan eksperimen berdasarkan model SiT-XL yang telah dilatih sebelumnya. Hasil eksperimen menunjukkan bahwa metode ini efektif meningkatkan kualitas sampel, terutama mencapai kemajuan signifikan dalam ImageReward dan Verifier Ensemble.
Hasil eksperimen menunjukkan bahwa kerangka kerja tersebut berkinerja baik pada berbagai tolok ukur. Dalam pengujian DrawBench, evaluasi LLM Grader menegaskan bahwa metode verifikasi pencarian dapat terus meningkatkan kualitas sampel. Secara khusus, ImageReward dan Verifier Ensemble telah mencapai peningkatan signifikan dalam berbagai metrik, berkat kemampuan evaluasi yang tepat dan konsistensi yang tinggi dengan preferensi manusia.
Studi ini tidak hanya menegaskan keefektifan metode perluasan komputasi berbasis pencarian, namun juga mengungkap bias yang melekat pada berbagai verifikator, sehingga menunjukkan jalan bagi pengembangan sistem verifikasi yang lebih terspesialisasi untuk tugas-tugas pembuatan visual di masa depan. Penemuan ini sangat penting untuk meningkatkan kinerja model generasi AI secara keseluruhan.
Penelitian ini memberikan ide-ide baru untuk meningkatkan efisiensi penalaran model difusi. Kerangka kerja dan metode yang diusulkan layak untuk penelitian dan penerapan lebih lanjut. Hal ini memberikan nilai referensi penting untuk pengembangan model generasi AI di masa depan, dan juga menunjukkan kualitas yang lebih efisien dan lebih tinggi Teknologi pembuatan gambar AI akan datang.