ในช่วงไม่กี่ปีที่ผ่านมาการพัฒนาอย่างรวดเร็วของเทคโนโลยีปัญญาประดิษฐ์ได้ดึงดูดความสนใจอย่างกว้างขวาง แต่ปัญหาทางกฎหมายและจริยธรรมที่ตามมาได้กลายเป็นที่โดดเด่นมากขึ้นเรื่อย ๆ เมื่อเร็ว ๆ นี้การปฏิบัติของ Meta ในการฝึกอบรมปัญญาประดิษฐ์ได้รับการสอบสวนโดยถูกกล่าวหาว่าดาวน์โหลดข้อมูลการละเมิดลิขสิทธิ์จำนวนมากอย่างผิดกฎหมายสำหรับการฝึกอบรมแบบจำลองเหตุการณ์ที่เกิดขึ้นได้จุดประกายการอภิปรายอย่างลึกซึ้งเกี่ยวกับลิขสิทธิ์และการใช้ข้อมูล
เมื่อเร็ว ๆ นี้วิธีการของ Meta ในการฝึกอบรมปัญญาประดิษฐ์ได้ดึงดูดความสนใจอย่างกว้างขวาง ตามการฟ้องร้อง บริษัท ถูกกล่าวหาว่าดาวน์โหลดหนังสืออิเล็กทรอนิกส์และบทความละเมิดลิขสิทธิ์จำนวนมากโดยไม่ได้รับอนุญาตให้ฝึกอบรมโมเดลปัญญาประดิษฐ์ หัวใจสำคัญของเหตุการณ์คืออีเมลที่รั่วไหลออกมาหลายครั้งซึ่งเป็นหลักฐานเพิ่มเติมเกี่ยวกับการกระทำของเมตา
Meta ยอมรับว่าดาวน์โหลดชุดข้อมูลขนาดใหญ่ที่มีความขัดแย้งที่เรียกว่า Libgen ที่มีหนังสือละเมิดลิขสิทธิ์หลายสิบล้านเล่มอีเมลแสดงให้เห็น ตามเอกสารของศาลที่โจทก์ยื่นข้อมูลเมตาดาวน์โหลดข้อมูลอย่างน้อย 81.7TB จากหลาย ๆ ห้องสมุดเงารวมถึงข้อมูลอย่างน้อย 35.7TB จาก Z-Library และ Libgen ผ่านเว็บไซต์ที่เรียกว่า Anna's Archive นอกจากนี้ Meta ก่อนหน้านี้ดาวน์โหลดข้อมูล 80.6TB จาก Libgen ตัวเลขเหล่านี้แสดงให้เห็นว่าขนาดของเมตาในการกระทำที่ผิดกฎหมายนี้น่าทึ่งมาก โจทก์ชี้ให้เห็นว่าในขณะที่การละเมิดลิขสิทธิ์ขนาดเล็กอื่น ๆ ได้นำไปสู่การดำเนินคดีทางกฎหมาย แต่พฤติกรรมของเมตาก็ยิ่งรุนแรงมากขึ้น
ในเนื้อหาของอีเมลพนักงาน Meta ยังแสดงความกังวลเกี่ยวกับความเสี่ยงทางกฎหมายของการกระทำของพวกเขา ในเดือนเมษายน 2566 Nikolai Bashlikov วิศวกรวิจัยของ บริษัท กล่าวว่า: "รู้สึกไม่เหมาะสมที่จะใช้แล็ปท็อปของ บริษัท เพื่อรับ BT" เขาตั้งข้อสังเกตว่า "การใช้ torrents หมายถึง 'เมล็ดพันธุ์' ไฟล์เช่นการแบ่งปันเนื้อหาภายนอกสิ่งนี้ไม่ได้รับอนุญาตตามกฎหมาย" อย่างไรก็ตามแม้จะมีคำเตือนเช่นนี้เมตาดูเหมือนว่าจะตัดสินใจปกปิดกิจกรรมการดาวน์โหลดและการแบ่งปัน "พฤติกรรมโดยการแก้ไขการตั้งค่า
Meta ยังกล่าวกันว่าได้พยายามลดความเสี่ยงของการถูกโยงไปถึงเซิร์ฟเวอร์โดยการดาวน์โหลดชุดข้อมูลไปยังเซิร์ฟเวอร์ที่ไม่ใช่เมตา พฤติกรรมชุดนี้ได้ก่อให้เกิดการสะท้อนกลับอย่างลึกซึ้งต่อการใช้ข้อมูลและลิขสิทธิ์ของ Meta
ประเด็นสำคัญ:
Meta ถูกกล่าวหาว่าดาวน์โหลดหนังสือละเมิดลิขสิทธิ์ 81.7TB อย่างผิดกฎหมายซึ่งสงสัยว่าถูกใช้สำหรับการฝึกอบรม AI
พนักงานแสดงความกังวลเกี่ยวกับความเสี่ยงทางกฎหมายและเตือนว่าการดาวน์โหลดอาจละเมิดกฎหมาย
เมตาพยายามที่จะหลบเลี่ยงความรับผิดทางกฎหมายโดยการซ่อนและใช้เซิร์ฟเวอร์ที่ไม่ใช่ บริษัท
เหตุการณ์นี้ไม่เพียง แต่เปิดเผยปัญหาการใช้ข้อมูลของเมตาเท่านั้น แต่ยังฟังการโทรปลุกสำหรับอุตสาหกรรม AI ทั้งหมด วิธีการค้นหาความสมดุลระหว่างการพัฒนาเทคโนโลยีและการปฏิบัติตามกฎหมายจะเป็นประเด็นสำคัญที่ต้องแก้ไขในอนาคต