Model pembuatan video Sora OpenAI telah menarik perhatian luas. Kemampuan pembuatan videonya yang kuat sungguh menakjubkan, namun sumber data pelatihannya membingungkan. Artikel ini akan menyelidiki kemungkinan sumber data pelatihan Sora, terutama peran yang dimainkan oleh siaran langsung game dan video strategi, serta menganalisis masalah hukum yang mungkin timbul dan dampaknya terhadap pengembangan AI di masa depan.
Artefak pembuatan video OpenAI, Sora, telah menarik banyak perhatian sejak diluncurkan, namun dari mana ia mempelajarinya selalu menjadi misteri. Kini, sebagian dari misterinya tampaknya telah terungkap: data latihan Sora kemungkinan besar berisi sejumlah besar siaran langsung game dan video strategi dari Twitch!
Sora seperti "ahli peniruan" yang terampil, mampu menghasilkan video berdurasi hingga 20 detik hanya dengan perintah teks atau gambar, dan dapat mengontrol berbagai rasio aspek dan resolusi. Pada bulan Februari tahun ini, ketika OpenAI pertama kali meluncurkan Sora, ia mengisyaratkan bahwa modelnya "berkonsentrasi pada latihan" dalam video "Minecraft". Jadi, selain "Minecraft", harta karun game apa lagi yang tersembunyi di "Rahasia Seni Bela Diri" Sora?
Hasilnya mengejutkan, karena Sora sepertinya sudah familiar dengan berbagai jenis permainan. Ini dapat menghasilkan video game tiruan dengan bayangan "Mario", meskipun ada beberapa "kelemahan kecil"; itu juga dapat mensimulasikan layar game tembak-menembak orang pertama yang mendebarkan, seperti "Call of Duty" dan "Counter-Strike" ; adalah "gabungan" "; Ini juga dapat menciptakan kembali adegan pertarungan dari game arcade "Teenage Mutant Ninja Turtles" di tahun 1990-an, membuat orang merasa seperti tenggelam dalam kenangan masa kecil.
Yang lebih mengejutkan lagi, Sora juga mengetahui dengan baik bentuk siaran langsung Twitch, yang berarti ia telah “menonton” konten siaran langsung dalam jumlah besar. Tangkapan layar video yang dihasilkan oleh Sora tidak hanya secara akurat menangkap struktur bingkai siaran langsung, tetapi juga dengan jelas mengembalikan gambar pembawa berita terkenal Auronplay, termasuk tato di lengan kirinya.
Tidak hanya itu, Sora juga "mengenal" pembawa berita Twitch Pokimane lainnya dan membuat video karakter yang mirip dengannya. Tentu saja, untuk menghindari masalah hak cipta, OpenAI telah menyiapkan mekanisme pemfilteran untuk mencegah Sora membuat video yang berisi karakter bermerek dagang.
Meskipun OpenAI bungkam mengenai sumber data pelatihannya, ada indikasi bahwa konten game kemungkinan besar disertakan dalam set pelatihan Sora. Dalam wawancara dengan Wall Street Journal pada bulan Maret, Mira Mulati, mantan CTO OpenAI, tidak secara langsung menyangkal bahwa Sora menggunakan konten dari YouTube, Instagram, dan Facebook untuk pelatihan. OpenAI juga mengakui dalam spesifikasi teknis Sora bahwa ia menggunakan data "yang tersedia untuk umum" serta data berlisensi dari perpustakaan media seperti Shutterstock.
Jika konten game memang digunakan untuk melatih Sora, hal ini dapat memicu serangkaian masalah hukum, terutama saat OpenAI mengembangkan pengalaman yang lebih interaktif berdasarkan Sora. Pengacara kekayaan intelektual Pryor Cashman Joshua Weigensberg menunjukkan bahwa penggunaan video game yang tidak sah untuk pelatihan AI akan menghadapi risiko besar, karena model pelatihan AI biasanya memerlukan penyalinan data pelatihan, dan video game berisi sejumlah besar materi pelajaran yang dilindungi hak cipta.
Model AI generatif seperti Sora didasarkan pada probabilitas. Mereka mempelajari pola dari sejumlah besar data dan membuat prediksi. Kemampuan ini memungkinkan mereka untuk “mempelajari” cara kerja dunia. Namun ada juga bahaya tersembunyi. Berdasarkan perintah tertentu, model dapat menghasilkan konten yang sangat mirip dengan data pelatihannya. Hal ini menimbulkan ketidakpuasan yang kuat di kalangan pencipta, yang percaya bahwa karya mereka digunakan untuk pelatihan tanpa izin.
Saat ini, Microsoft dan OpenAI sedang dituntut atas alat AI mereka yang diduga menyalin kode berlisensi. Perusahaan aplikasi seni AI seperti Midjourney, Runway, dan Stability AI juga menghadapi tuduhan melanggar hak seniman. Perusahaan musik besar juga telah mengajukan tuntutan hukum terhadap Udio dan Suno, startup yang mengembangkan generator lagu AI.
Banyak perusahaan AI telah lama mendukung prinsip-prinsip "penggunaan wajar", dengan alasan bahwa model mereka menciptakan karya yang "transformatif" dan bukan plagiarisme. Namun konten game tersebut memiliki kekhasan tersendiri. Evan Everest, pengacara hak cipta di Dorsey & Whitney, menunjukkan bahwa video game melibatkan setidaknya dua lapisan perlindungan hak cipta: hak cipta atas konten game yang dimiliki oleh pengembang game, dan hak cipta atas video unik yang dibuat oleh pemutar atau video tersebut. produsen. Untuk beberapa game, mungkin juga terdapat hak tingkat ketiga, yaitu hak cipta atas konten buatan pengguna.
Misalnya, Fortnite memungkinkan pemain membuat peta permainan mereka sendiri dan membaginya dengan orang lain. Video game tentang peta ini melibatkan setidaknya tiga pemilik hak cipta: Epic, gamer, dan pembuat peta. Jika pengadilan memutuskan bahwa pelatihan model AI melibatkan tanggung jawab hak cipta, pemilik hak cipta ini dapat menjadi calon penggugat atau sumber resmi.
Selain itu, Weigensberg juga menunjukkan bahwa game itu sendiri juga memiliki banyak elemen yang "dapat dilindungi", seperti tekstur kepemilikan, yang dapat dipertimbangkan oleh hakim dalam litigasi kekayaan intelektual.
Saat ini, beberapa studio dan penerbit game termasuk Epic, Microsoft (pemilik Minecraft), Ubisoft, Nintendo, Roblox, dan pengembang Cyberpunk 2077 CD Projekt Red belum mengomentari masalah tersebut.
Sekalipun perusahaan AI memenangkan sengketa hukum ini, pengguna tidak dapat dibebaskan dari tanggung jawab. Jika model generatif menyalin karya berhak cipta, orang yang menerbitkan karya tersebut atau memasukkannya ke dalam proyek lain mungkin masih bertanggung jawab atas pelanggaran kekayaan intelektual.
Beberapa perusahaan AI mempunyai klausul kompensasi untuk menghadapi situasi seperti itu, namun biasanya ada pengecualian. Misalnya, ketentuan OpenAI hanya berlaku untuk pelanggan perusahaan, bukan pengguna individu. Selain risiko hak cipta, terdapat juga risiko seperti pelanggaran merek dagang, misalnya konten keluaran mungkin berisi aset yang digunakan untuk pemasaran dan branding, termasuk karakter dalam game.
Seiring dengan meningkatnya minat terhadap model dunia, situasinya mungkin menjadi lebih kompleks. Salah satu penerapan model dunia adalah untuk menghasilkan video game kehidupan nyata, yang dapat menimbulkan masalah hukum jika game "sintetis" tersebut terlalu mirip dengan model yang dilatih.
Avery Williams, pengacara litigasi kekayaan intelektual di McKool Smith, menunjukkan bahwa elemen seperti suara, gerakan, karakter, lagu, dialog, dan karya seni yang digunakan untuk melatih platform AI dalam game merupakan pelanggaran hak cipta. Pertanyaan tentang “penggunaan wajar” yang diajukan dalam berbagai tuntutan hukum terhadap perusahaan AI generatif akan berdampak sama pada industri video game seperti pasar kreatif lainnya.
Keberhasilan Sora juga menyoroti potensi besar teknologi AI generatif di bidang pembuatan konten, namun juga mengungkap tantangan besarnya dalam penggunaan data dan hak kekayaan intelektual. Bagaimana menyeimbangkan inovasi teknologi dan perlindungan kekayaan intelektual akan menjadi isu utama yang perlu dipecahkan dalam pengembangan AI di masa depan. Di masa depan, sumber data pelatihan model AI dan legalitasnya akan diperiksa lebih ketat, yang akan berdampak besar pada perkembangan industri AI di masa depan.