Baru -baru ini, OpenAI merilis berita menarik: dalam proyek pengujian internalnya, Sora, di samping fungsi pembuatan video yang telah diluncurkan, fungsi pembuatan gambar juga sedang dikembangkan dalam ayunan penuh. Fitur baru ini memungkinkan pengguna untuk dengan cepat beralih antara pembuatan video dan gambar, meningkatkan fleksibilitas kreatif.
Menurut pesan internal, Sora akan menambahkan tombol sakelar tersembunyi, dan pengguna dapat beralih di antara kedua mode dengan hanya memilih di bilah prompt. Saat memilih pembuatan gambar, sistem akan secara otomatis meminta pengguna untuk menggambarkan suatu gambar. Desain ini dirancang untuk menyederhanakan operasi pengguna dan meningkatkan relevansi dan kualitas konten yang dihasilkan.
Selain peningkatan kemampuan pembuatan gambar, Sora juga telah mereklasifikasi dorongan videonya. Kategori "terbaik" dan "teratas" yang baru diluncurkan akan membantu pengguna memfilter dan menemukan konten yang lebih baik. Kategori "terbaik" mirip dengan saluran unggulan saat ini, sedangkan kategori "atas" dapat memberi peringkat video berdasarkan jumlah suka dari pengguna atau periode waktu. Perubahan dalam kategori ini membuat orang menantikan mekanisme rekomendasi konten Sora.
Untuk pengguna Dall-E3, berita itu tidak diragukan lagi menarik, karena Dall-E3 agak sudah ketinggalan zaman sejak diluncurkan, terutama jika dibandingkan dengan pesaing seperti Midjourney. Meskipun fungsi pembuatan gambar Sora belum diluncurkan secara resmi, kategori "gambar internal" di bilah navigasi kiri telah membangkitkan rasa ingin tahu pengguna. Meskipun kategori ini saat ini terutama digunakan untuk dorongan video, ini juga dapat menyediakan konten terkait untuk pembuatan gambar di masa depan.
Beberapa orang berspekulasi bahwa model pembuatan gambar ini dapat disebut Dall-E4, tetapi Openai belum mengkonfirmasi hal ini. Pakar industri berspekulasi bahwa generator gambar di Sora mungkin tidak menggunakan Dall-E4 secara langsung, tetapi akan bergantung pada model "Sora-Turbo" yang ada. Selain itu, orang dalam industri juga menunjukkan bahwa ChatGPT belum meluncurkan fungsi pembuatan gambar multimodal berdasarkan GPT-4O, sehingga peluncuran proyek Sora akan menjadi kemajuan baru yang layak diperhatikan.
Perlu dicatat bahwa nama kode dari generator teks-ke-gambar di Sora disebut "pepaya", yang membuat orang penasaran dan hamil tentang proyek ini. Satu setengah tahun setelah rilis Dall-E3, inovasi macam apa yang akan dibawa oleh model generasi berikutnya adalah sesuatu yang membuat orang ingin mengetahuinya.
Singkatnya, fungsi pembuatan gambar Sora akan akan diluncurkan, memberikan pengguna kemungkinan yang lebih kreatif, yang layak dinanti -nantikan.