Baru-baru ini, New York Times dan Daily News mengajukan gugatan hak cipta terhadap OpenAI, menuduh OpenAI menggunakan karyanya untuk melatih model AI tanpa izin. Kasus ini berfokus pada fakta bahwa para insinyur OpenAI secara tidak sengaja menghapus bukti-bukti yang mungkin penting dalam kasus tersebut, sehingga menimbulkan kekhawatiran luas. Langkah ini tidak hanya berdampak pada proses persidangan kasus tersebut, namun juga mengungkap potensi risiko dan masalah etika pemrosesan data selama pelatihan model bahasa besar. Artikel ini akan menganalisis seluk beluk kejadian ini secara detail dan mendalami dampaknya terhadap perkembangan industri kecerdasan buatan.
Baru-baru ini, The New York Times dan Daily News bersama-sama menggugat OpenAI, menuduhnya menggunakan karya mereka untuk melatih model kecerdasan buatan tanpa izin.
Perkembangan kasus ini menarik perhatian publik karena tim hukum penggugat menunjukkan dalam dokumen pengadilan terbaru bahwa insinyur OpenAI secara tidak sengaja menghapus bukti yang mungkin berdampak penting pada kasus tersebut saat memproses data yang relevan.
Dilaporkan bahwa OpenAI setuju untuk menyediakan dua mesin virtual pada musim gugur ini sehingga tim hukum penggugat dapat mencari data pelatihannya untuk konten berhak cipta. Mesin virtual adalah komputer virtual yang berjalan dalam sistem operasi komputer dan biasanya digunakan untuk pengujian, pencadangan data, dan menjalankan aplikasi. Penasihat hukum dari The New York Times dan Daily News serta para ahli yang mereka sewa telah mengerjakan data pelatihan OpenAI selama lebih dari 150 jam sejak 1 November.
Namun, pada 14 November, para insinyur OpenAI secara tidak sengaja menghapus data pencarian yang disimpan di salah satu mesin virtual. Menurut surat dari pengacara penggugat, meskipun OpenAI berusaha memulihkan data yang hilang, dan berhasil dalam banyak kasus, data yang dipulihkan tidak dapat digunakan untuk menentukan berita mana dari artikel penggugat karena struktur folder dan nama filenya berbeda. "tidak dapat dipulihkan." Cara menggunakannya untuk melatih model OpenAI.
Penasihat hukum penggugat mencatat bahwa mereka tidak yakin penghapusan tersebut disengaja, namun insiden tersebut menunjukkan bahwa OpenAI "berada dalam posisi terbaik untuk mencari kumpulan datanya sendiri untuk mencari konten yang berpotensi melanggar." Artinya OpenAI harus menggunakan alatnya sendiri untuk menemukan konten relevan yang melanggar dengan lebih efisien.
OpenAI telah menyatakan dalam kasus ini dan kasus serupa lainnya bahwa menggunakan data yang tersedia untuk umum untuk pelatihan model adalah penggunaan yang wajar. Artinya OpenAI yakin mereka tidak perlu membayar royalti untuk penggunaan contoh-contoh ini, meskipun mereka menghasilkan uang dari model-model ini.
Perlu disebutkan bahwa OpenAI telah menandatangani perjanjian lisensi dengan semakin banyak media baru, termasuk Associated Press, Business Insider, Financial Times, dll., namun OpenAI belum mengungkapkan ketentuan spesifik dari perjanjian ini. Dilaporkan bahwa mitra konten Dotdash menerima setidaknya US$16 juta sebagai kompensasi tahunan.
Meskipun terdapat perselisihan hukum, OpenAI tidak mengonfirmasi atau menyangkal penggunaan karya berhak cipta tertentu untuk pelatihan AI tanpa izin.
Menyorot:
OpenAI telah dituduh secara keliru menghapus bukti-bukti penting dalam gugatan hak cipta.
Pengacara penggugat mengatakan mereka menghabiskan banyak waktu dan tenaga untuk memulihkan data.
OpenAI menyatakan bahwa penggunaan data yang tersedia untuk umum untuk melatih modelnya adalah penggunaan wajar.
Insiden ini menyoroti kompleksitas masalah sumber dan hak cipta data pelatihan model kecerdasan buatan, dan juga menimbulkan kekhawatiran tentang keamanan data dan pengelolaan bukti. Apakah perilaku OpenAI merupakan pelanggaran dan bagaimana mendefinisikan batasan “penggunaan wajar” akan menjadi isu penting yang memerlukan diskusi lebih lanjut di masa depan. Hasil akhir dari kasus ini akan berdampak besar pada perkembangan industri kecerdasan buatan.