Baru-baru ini, media mengungkapkan bahwa Nvidia diam-diam mengambil data video YouTube dalam skala besar untuk melatih model AI-nya, sehingga memicu kontroversi hukum dan etika yang meluas. Langkah ini melibatkan banyak produk AI Nvidia, termasuk model pembelajaran mendalam Cosmos, algoritma mengemudi otonom, dll. Metode akuisisi data disembunyikan dan tanpa izin dari pembuat video dan Google. Email internal NVIDIA menunjukkan bahwa para eksekutif senior optimis dengan perilaku ini dan yakin bahwa perilaku tersebut telah "disetujui sepenuhnya". Pernyataan ini bertentangan dengan pernyataan resmi Google yang dengan jelas menyatakan bahwa perilaku ini melanggar persyaratan layanan platform. Banyaknya data yang terlibat, metode operasi rahasia, dan respon yang sangat berbeda dari semua pihak membuat kejadian ini menjadi perhatian.
Baru-baru ini, operasi rahasia raksasa teknologi Nvidia dalam akuisisi data terungkap. Menurut laporan dari media 404, Nvidia melatih model kecerdasan buatan mereka dengan mengambil data video YouTube dalam jumlah besar, yang cukup ambigu dari segi hukum dan etika.
Laporan tersebut menunjukkan bahwa Nvidia menggunakan data video ini untuk melatih berbagai model AI-nya, termasuk model pembelajaran mendalam Cosmos, algoritma mengemudi otonom, produk avatar AI manusia digital, dan alat pembangunan dunia 3D Omniverse.
Dapat dipahami bahwa Nvidia telah mengambil banyak tindakan terselubung untuk menutupi perilaku pengikisan data mereka, menggunakan beberapa "mesin virtual" dan terus-menerus mengubah alamat IP agar tidak ditemukan oleh YouTube. Apalagi pembuat video dan perusahaan induk YouTube, Google, tidak memberikan izin apa pun atas aktivitas pengikisan data ini. Komunikasi internal Nvidia menunjukkan bahwa strategi mereka cukup berani. Salah satu eksekutif menyebutkan dalam email bahwa mereka sedang membangun “pabrik data video” yang dapat menghasilkan data pengalaman visual yang setara dengan masa hidup manusia setiap hari.
Menariknya, ketika karyawan mengungkapkan kekhawatirannya mengenai legalitas dan etika perolehan data tersebut, manajemen tampak cukup yakin, percaya bahwa semua ini adalah keputusan tingkat tinggi. "Kami mendapat persetujuan menyeluruh atas semua data," tulis email tersebut.
Yang lebih meresahkan adalah bahwa Nvidia sudah lama mengetahui bahwa mereka menggunakan kumpulan data HD-VG-130M yang berisi 130 juta video YouTube, yang awalnya dibuat untuk penelitian akademis. Banyak ahli yang menyatakan ketidakpuasannya terhadap hal ini, dengan alasan bahwa komersialisasi data yang digunakan untuk penelitian tidak tepat.
Sebagai pemain inti dalam industri AI, NVIDIA menempati posisi menonjol di pasar, dan unit pemrosesan grafis (GPU)-nya menjadi dasar bagi banyak sistem AI yang intensif komputasi. Perusahaan yang bekerja sama dengan Nvidia, seperti OpenAI, Microsoft, dan Google, telah menyatakan keprihatinannya atas perilaku ini. Juru bicara Google menyebutkan bahwa menggunakan data YouTube tanpa izin jelas merupakan pelanggaran terhadap persyaratan layanan platform.
Menanggapi media, Nvidia mengklaim bahwa praktik pelatihan AI mereka “sepenuhnya sesuai dengan semangat dan ketentuan undang-undang hak cipta.” Namun, apa pendapat para kreator yang menggunakan konten ini mengenai pernyataan tersebut?
Menyorot:
Nvidia diam-diam mengambil sejumlah besar data video YouTube untuk pelatihan AI, sehingga menimbulkan kekhawatiran tentang masalah hukum dan etika.
? Email internal menunjukkan bahwa para eksekutif Nvidia yakin bahwa perilaku ini disetujui sepenuhnya dan sikap mereka cukup berani.
? Google menunjukkan bahwa penggunaan data YouTube tanpa izin jelas melanggar persyaratan layanan platform, dan tanggapan Nvidia menimbulkan kontroversi.
Perilaku pengumpulan data NVIDIA memicu diskusi luas mengenai etika dan hukum akuisisi data AI, dan tanggapannya gagal meredam kontroversi tersebut. Insiden ini menyoroti tantangan yang dihadapi oleh perusahaan teknologi besar dalam penggunaan data, dan kebutuhan mendesak untuk memperbaiki undang-undang dan peraturan terkait. Di masa depan, insiden serupa mungkin akan terus menarik perhatian dan mendorong industri untuk memperkuat disiplin diri dan menstandardisasi perilaku penggunaan data.