Sebuah terobosan besar! Teknologi baru OpenAI mempercepat gambar AI sebanyak 50 kali lipat, hanya membutuhkan 0,11 detik untuk menghasilkan gambar

Penulis：Eve Cole Waktu Pembaruan：2024-12-04 13:48:01

Editor Downcodes melaporkan: OpenAI merilis sCM teknologi pembuatan gambar AI yang revolusioner, yang telah membuat kemajuan terobosan dalam kecepatan dan efisiensi pembuatan gambar dan dapat disebut sebagai tonggak sejarah di bidang gambar AI. Dengan menyederhanakan langkah perhitungan, model sCM mencapai efek ajaib dalam menghasilkan gambar berkualitas tinggi hanya dalam dua langkah, dan 50 kali lebih cepat dibandingkan model difusi tradisional. Hanya membutuhkan 0,11 detik untuk menghasilkan gambar pada GPU A100, dan parameter model maksimum mencapai 1,5 miliar, yang merupakan rekor industri baru. Teknologi ini tidak hanya mencapai hasil pengujian yang sangat baik pada kumpulan data CIFAR-10 dan ImageNet, namun juga menunjukkan potensi ekspansi yang kuat, sehingga meletakkan dasar yang kokoh untuk pelatihan model berskala lebih besar di masa depan.

Keuntungan inti teknis:

Hasilkan gambar berkualitas tinggi hanya dalam dua langkah perhitungan

Hanya membutuhkan waktu 0,11 detik untuk menghasilkan gambar di A100GPU

Dibandingkan dengan model difusi tradisional, kecepatannya meningkat 50 kali lipat

Parameter model maksimum mencapai 1,5 miliar, mencetak rekor baru

Dalam pengujian sebenarnya, sCM tampil mengesankan. Ini mencapai skor FID 2,06 pada kumpulan data CIFAR-10 dan skor luar biasa 1,88 saat menghasilkan gambar 512x512 piksel di ImageNet. Metrik ini hanya tertinggal sekitar 10% dari model difusi terbaik yang ada, namun mewakili lompatan kualitatif dalam kecepatan.

Kunci inovasi teknologi adalah memecahkan masalah mendasar model konsistensi tradisional. Model sebelumnya menggunakan langkah waktu terpisah, yang tidak hanya memerlukan parameter tambahan tetapi juga rawan kesalahan. Tim peneliti OpenAI menyatukan berbagai metode dengan menetapkan kerangka teori yang disederhanakan dan berhasil mengidentifikasi serta memecahkan penyebab utama ketidakstabilan pelatihan.

Yang lebih menarik lagi adalah teknologi ini menunjukkan potensi ekspansi yang kuat. OpenAI berhasil melatih model dengan 1,5 miliar parameter pada kumpulan data ImageNet, yang merupakan pertama kalinya untuk model serupa. Studi ini menemukan bahwa seiring bertambahnya ukuran model, kualitas gambar terus meningkat, yang berarti pelatihan model berskala lebih besar mungkin dapat dilakukan di masa mendatang.

Munculnya teknologi sCM menandai gelombang baru perkembangan di bidang pembuatan gambar AI. Peningkatan besar dalam kecepatan dan efisiensi akan memberikan kemungkinan untuk lebih banyak skenario aplikasi. Mari kita tunggu dan lihat apa yang akan dihadirkan OpenAI di masa depan terobosan!