Masalah hak cipta data pelatihan model besar AI menyoroti nilai database pelatihan berkualitas tinggi yang mungkin dinilai terlalu tinggi

Penulis：Eve Cole Waktu Pembaruan：2025-02-03 15:00:03

Baru-baru ini, raksasa di bidang kecerdasan buatan telah membuat rencana dan sering mengambil tindakan dalam akuisisi data dan kerja sama teknis. Artikel ini akan fokus pada beberapa berita penting dan menganalisis dampaknya terhadap perkembangan dan tren masa depan industri kecerdasan buatan. Berita tersebut melibatkan kesepakatan besar Reddit dengan Google dan kerja sama mendalam OpenAI dengan berbagai organisasi penerbitan, yang menunjukkan besarnya permintaan akan data berkualitas tinggi untuk pelatihan model besar dan peran penting yang dimainkan industri penerbitan di dalamnya. Kolaborasi ini tidak hanya memberikan dorongan baru bagi pengembangan kecerdasan buatan, namun juga menunjukkan bahwa perolehan dan pemanfaatan sumber daya data akan lebih terstandarisasi dan dikomersialkan di masa depan.

Reddit dan Google memiliki perjanjian senilai sekitar $60 juta per tahun, menurut orang-orang yang mengetahui masalah tersebut. Springer Publishing Group telah bermitra dengan OpenAI untuk menjadi organisasi penerbitan pertama yang mengintegrasikan jurnalisme dan teknologi kecerdasan buatan secara mendalam. Kolaborasi OpenAI dengan Axel Springer menunjukkan bahwa pelatihan model berukuran besar mungkin memerlukan akses berbayar ke data. Perusahaan di industri penerbitan memiliki sumber daya grafis dan teks elektronik yang kaya, yang dapat menjadi kumpulan data pelatihan model besar yang penting. CITIC Publishing mencoba bekerja sama dengan penulis dan perusahaan model besar untuk pelatihan bahasa, dan Palm Reading Technology melakukan kerja sama mendalam dengan Byte dalam berbagai aspek seperti hak cipta dan produksi konten.

Dari kasus-kasus di atas terlihat bahwa industri kecerdasan buatan sedang dalam tahap perkembangan pesat, dan persaingan sumber daya data menjadi semakin ketat. Di masa depan, metode perolehan dan pemanfaatan data akan mengalami perubahan besar juga membawa peluang dan tantangan baru bagi industri penerbitan.