Baru-baru ini, pelatihan korpus Gemini-Pro China milik Google memicu diskusi hangat. Pihaknya mengaku menggunakan data Baidu Wenxin Yiyan untuk pelatihan, yang menyebabkan keributan di media sosial. Banyak netizen yang mempertanyakan apakah ada persaingan tidak sehat di antara perusahaan besar, sehingga memicu diskusi tentang sumber dan etika data pelatihan model kecerdasan buatan. Inti dari insiden ini adalah Gemini-Pro mengandalkan data Baidu Wenxinyiyan dalam pelatihan korpus Tiongkok. Hal ini secara langsung menantang batasan industri dalam kepemilikan data dan hak kekayaan intelektual, dan juga mengungkap kemungkinan risiko dan bahaya tersembunyi dalam pelatihan model bahasa skala besar. .
Artikel ini berfokus pada:
Korpus Google Gemini-Pro Tiongkok menimbulkan kontroversi karena terungkap bahwa mereka menggunakan Baidu Wenxinyiyan untuk pelatihan. Netizen bertanya-tanya apakah perusahaan-perusahaan besar mencoba mencuri perhatian satu sama lain. Gemini-Pro menarik perhatian media sosial setelah terlihat bingung tentang identitasnya selama pengujian. Pejabat Gemini akhirnya mengakui menggunakan Baidu Wenxin untuk data pelatihan Tiongkok, sehingga semakin mengintensifkan topik tersebut.
Insiden ini tidak hanya menyoroti kontradiksi antara pembagian sumber daya data dan perlindungan kekayaan intelektual di bidang kecerdasan buatan, namun juga menimbulkan kekhawatiran tentang kepercayaan dan transparansi model bahasa besar. Di masa depan, pelatihan dan penerapan model kecerdasan buatan akan memerlukan manajemen yang lebih terstandarisasi dan standar etika yang lebih ketat untuk memastikan perkembangan industri yang sehat.