Tim peneliti dari Universitas Sains dan Teknologi Hong Kong dan Universitas Sains dan Teknologi Tiongkok bersama-sama mengembangkan model GameGen-X, model konverter difusi yang dapat menghasilkan dan secara interaktif mengontrol video permainan dunia terbuka. GameGen-X tidak hanya dapat menghasilkan video game yang mencakup karakter inovatif, lingkungan dinamis dan tindakan kompleks, tetapi juga menyesuaikan konten game secara real time sesuai dengan instruksi multimodal pengguna (seperti teks dan operasi keyboard), yang memungkinkan pengguna mengalami kesenangan merancang dalam merancang permainan sendiri. Hasil penelitian ini menandai terobosan besar di AI di bidang pengembangan game dan memberikan kemungkinan baru untuk pembuatan konten game.
GameGen-X dapat menghasilkan video game dunia terbuka dengan sendirinya, yang dapat mensimulasikan berbagai fungsi mesin game, termasuk menghasilkan karakter inovatif, lingkungan yang dinamis, tindakan kompleks dan berbagai acara, dan juga dapat berinteraksi dengan Anda, memungkinkan Anda untuk mengalami kesenangan berada perencanaan permainan.
Salah satu yang menarik dari GameGen-X adalah kemampuan terkontrol dalam interaksi. Ini dapat memprediksi dan mengubah konten di masa depan berdasarkan klip game saat ini, sehingga memungkinkan simulasi gameplay.
Pengguna dapat mempengaruhi konten yang dihasilkan melalui sinyal kontrol multimodal, seperti instruksi teks terstruktur dan kontrol keyboard, sehingga mencapai kontrol atas interaksi karakter dan konten adegan.
Untuk melatih GameGen-X, para peneliti juga membangun dataset video game dunia terbuka besar pertama, Ogamedata. Dataset ini berisi lebih dari 1 juta klip video game yang berbeda dari lebih dari 150 game, dan menggunakan GPT-4O untuk menghasilkan deskripsi teks yang informatif untuk itu.
Proses pelatihan GameGen-X dibagi menjadi dua tahap: model dasar pra-pelatihan dan penyesuaian instruksi. Pada fase pertama, model ini pra-terlatih melalui tugas-tugas pembuatan teks-ke-video dan kelanjutan video, memungkinkannya untuk menghasilkan video game domain terbuka yang berkualitas tinggi dan berkualitas tinggi.
Pada fase kedua, untuk mencapai kemampuan kontrol interaktif, para peneliti merancang modul Instruktur, yang mengintegrasikan para ahli sinyal kontrol multimodal yang terkait dengan permainan.
Instrukturnet memungkinkan model untuk menyesuaikan representasi potensial berdasarkan input pengguna, sehingga menyatukan interaksi karakter dan kontrol konten adegan dalam pembuatan video untuk pertama kalinya. Selama penyempurnaan instruksi, hanya Instruktur yang diperbarui, sedangkan model dasar pra-terlatih dibekukan, memungkinkan model untuk mengintegrasikan kemampuan kontrol interaktif tanpa kehilangan keragaman dan kualitas konten video yang dihasilkan.
Hasil eksperimen menunjukkan bahwa GameGen-X berkinerja baik dalam menghasilkan konten game berkualitas tinggi dan memberikan kontrol yang sangat baik atas lingkungan dan karakter, lebih unggul dari model open source dan bisnis lainnya.
Tentu saja, AI ini masih dalam masa pertumbuhan dan masih ada jalan panjang sebelum benar -benar menggantikan perencanaan permainan. Tetapi kemunculannya tidak diragukan lagi membawa kemungkinan baru untuk pengembangan game. Ini memberikan pendekatan baru untuk desain dan pengembangan konten game, menunjukkan potensi model generatif sebagai alat tambahan untuk teknologi rendering tradisional, secara efektif mengintegrasikan generasi kreatif dan fungsi interaktif, membawa hal -hal baru ke kemungkinan pengembangan game di masa depan.
Alamat Proyek: https://gamegen-x.github.io/
Meskipun GameGen-X masih dalam tahap awal pengembangan, kinerjanya yang luar biasa dalam pembuatan video game dan kontrol interaksi menunjukkan prospek luas untuk penerapan teknologi AI di industri game. Di masa depan, GameGen-X diharapkan menjadi asisten yang baik untuk pengembang game dan mempromosikan pengembangan inovatif industri game.