Reddit baru-baru ini mengumumkan pengetatan langkah-langkah perlindungan data yang bertujuan untuk mencegah perusahaan AI yang tidak sah dan alat pengikis data mengakses data platformnya. Langkah ini menyoroti semakin tegangnya hubungan antara platform media sosial dan industri kecerdasan buatan, dan mencerminkan trade-off antara melindungi data pengguna dan mengeksplorasi model keuntungan baru. Reddit memperbarui file robots.txt untuk memblokir perayapan otomatis yang tidak sah, namun menyatakan bahwa hal itu tidak akan memengaruhi peneliti dan institusi yang patuh. Langkah ini mungkin terkait dengan laporan bahwa beberapa perusahaan AI telah mengabaikan perjanjian robots.txt. Hal ini juga menyiratkan bahwa Reddit mungkin akan mencapai perjanjian lisensi dengan lebih banyak perusahaan AI di masa depan, serupa dengan yang dicapai dengan perusahaan seperti Google dan OpenAI untuk mencapai pemanfaatan data. dan nilai komersial.
Reddit berencana memperbarui protokol pengecualian robotnya (file robots.txt) untuk memblokir pengikisan otomatis platform yang tidak sah. Seorang juru bicara perusahaan menekankan bahwa pembaruan tersebut tidak spesifik untuk perusahaan tetapi dimaksudkan untuk "melindungi Reddit sekaligus menjaga internet tetap terbuka." Reddit mengatakan perubahan tersebut tidak akan mempengaruhi “aktor integritas” seperti Internet Archive dan peneliti.
Langkah ini tampaknya merupakan respons terhadap laporan terbaru bahwa perusahaan AI, seperti Perplexity, mengabaikan protokol robots.txt situs web tersebut. CEO Perplexity pernah mengatakan dalam sebuah wawancara dengan "Fast Company" bahwa perjanjian tersebut "bukanlah kerangka hukum", yang memicu kontroversi mengenai praktik akuisisi data perusahaan AI.
Posisi Reddit jelas: Perusahaan mana pun yang menggunakan proxy otomatis untuk mengakses platformnya harus mematuhi syarat dan kebijakannya serta berkomunikasi dengan Reddit. Hal ini mungkin mengisyaratkan bahwa Reddit berharap untuk membuat perjanjian lisensi dengan perusahaan AI serupa dengan yang dimilikinya dengan Google dan OpenAI.
Ini bukan pertama kalinya Reddit mengambil tindakan tegas terhadap akses data. Tahun lalu, perusahaan tersebut mulai menagih perusahaan AI untuk penggunaan API dan mencapai perjanjian lisensi dengan beberapa perusahaan AI untuk mengizinkan mereka menggunakan data Reddit untuk melatih model. Perjanjian ini telah menjadi sumber pendapatan penting bagi Reddit.
Langkah Reddit mencerminkan keseimbangan platform media sosial antara melindungi konten buatan pengguna dan mengejar model pendapatan baru. Dengan pesatnya perkembangan teknologi AI, sengketa akses data serupa mungkin terjadi di platform lain, sehingga memicu diskusi yang lebih luas mengenai kepemilikan data, hak penggunaan, dan distribusi nilai.
Sikap keras Reddit menandai perubahan dalam model kerja sama data di masa depan antara platform media sosial dan perusahaan AI, dan juga memberikan alasan baru untuk diskusi mengenai kepemilikan dan pemanfaatan data. Permainan antar platform dan peningkatan pengawasan data akan menjadi isu penting dalam pembangunan di masa depan.