Meta ทำให้เกิดการโต้เถียงกันอย่างมากเนื่องจากแหล่งข้อมูลการฝึกอบรม AI Llama3 ล่าสุด ตามไฟล์ที่เปิดเผย Meta ใช้ Genesis เว็บไซต์ E -book ที่ละเมิดลิขสิทธิ์ (LIBGEN) เพื่อฝึกอบรม LLAMA3 ซึ่งกระตุ้นความกังวลอย่างกว้างขวางเกี่ยวกับลิขสิทธิ์และการเป็นเจ้าของข้อมูล แม้ว่าพนักงานภายในของ Meta ได้แสดงความกังวลเกี่ยวกับการใช้ความเสี่ยงของ Libgen รวมถึงความเสี่ยงทางกฎหมายที่อาจเกิดขึ้นและความคิดเห็นเชิงลบของประชาชน CEO Zuckerberg ยังคงอนุมัติการตัดสินใจครั้งนี้โดยเน้นถึงกลยุทธ์ที่รุนแรงของ บริษัท เทคโนโลยีขนาดใหญ่ในการแข่งขัน AI และลิขสิทธิ์
เมื่อเร็ว ๆ นี้ด้วยเอกสารของ Meta ที่เปิดเผยในคดีโดยรวมเกี่ยวกับลิขสิทธิ์ บริษัท ใช้ห้องสมุด e -book ที่ละเมิดลิขสิทธิ์ชื่อ Library Genesis (Libgen) เพื่อฝึกอบรมหุ่นยนต์แชท AI ล่าสุด Llama3 ซึ่งได้รับความสนใจอย่างกว้างขวาง ไฟล์เหล่านี้แสดงให้เห็นว่าวิศวกรของ Meta ได้หารือถึงความเสี่ยงที่อาจเกิดขึ้นจากการใช้ Libgen ซึ่งเป็น "ห้องสมุดเงา" โดยเฉพาะอย่างยิ่งในบริบทของลิขสิทธิ์และการเป็นเจ้าของข้อมูลที่โดดเด่นมากขึ้น แม้จะมีผลกระทบด้านลบและความเสี่ยงต่อความคิดเห็นของประชาชน Mark Zuckerberg ซีอีโอของ Meta ยังคงอนุมัติการตัดสินใจ
ตามคำร้องขอของศาลบันทึกการสนทนาที่เป็นความลับภายในของเมตาของการใช้ชุดข้อมูล libgen ถูกถอดรหัส ของ Llama3 ในอีเมล Sony Theakanath ผู้อำนวยการฝ่ายบริหารผลิตภัณฑ์ของ Meta ชี้ให้เห็นว่าแม้ว่าการตัดสินใจใช้ Libgen ได้ก่อให้เกิดความเสี่ยงของความคิดเห็นสาธารณะ บริษัท AI อื่น ๆ ก็ใช้ข้อมูลที่คล้ายกันซึ่งทำให้ทีมเมตารู้สึกว่าถนนสายนี้ไม่ได้เป็น ตามลำพัง.
สิ่งที่น่ากังวลยิ่งกว่านั้นคือพนักงานเมตาได้พูดคุยกันถึงวิธีการประมวลผลและกรองข้อความใน Libgen เพื่อลบโลโก้ลิขสิทธิ์เช่น ISBN และคำสั่งลิขสิทธิ์ บันทึกภายในระบุว่าวัสดุที่จัดทำโดย Libgen คือ "เอกสารคุณภาพสูงและเอกสารยาวซึ่งเหมาะสำหรับการเรียนรู้ความรู้ระดับมืออาชีพพิเศษ" นี่แสดงให้เห็นว่าเมตาดูเหมือนจะพยายามซ่อนเนื้อหาที่ไม่ได้รับอนุญาต
นอกจากนี้พนักงาน Meta ยังกล่าวถึงในอีเมลว่าอาจไม่เหมาะสมที่จะใช้ที่อยู่ IP ของ บริษัท สำหรับการดาวน์โหลดเมล็ดพันธุ์โดยตรงและแสดงความกังวลเกี่ยวกับพฤติกรรมนี้ อย่างไรก็ตามในกรณีที่ไม่มีการใช้ชุดข้อมูล Libgen ของ Zuckerberg ความคิดที่ชนะของ Meta ในการแข่งขัน AI ได้ถูกเปิดเผย เหตุการณ์นี้ทำให้เกิดความสนใจและสงสัยอีกครั้งเกี่ยวกับปัญหาของ บริษัท เทคโนโลยีขนาดใหญ่เกี่ยวกับปัญหาลิขสิทธิ์
ผลลัพธ์ของคดีลิขสิทธิ์นี้อาจมีผลกระทบสำคัญต่อกรณีอื่น ๆ ที่คล้ายคลึงกันโดยเฉพาะอย่างยิ่งการใช้งานสร้างสรรค์เช่นรูปภาพดนตรีและวรรณกรรม ด้วยความต้องการที่เพิ่มขึ้นสำหรับเนื้อหาดั้งเดิมของ บริษัท เทคโนโลยีสิทธิและความสนใจของผู้สร้างเนื้อหาต้นฉบับจะกลายเป็นจุดสนใจของความสนใจ
เหตุการณ์นี้ไม่เพียง แต่เปิดเผยทัศนคติที่ไม่รับผิดชอบของ Meta ต่อปัญหาลิขสิทธิ์ แต่ยังทำให้ผู้คนคิดอย่างลึกซึ้งเกี่ยวกับปัญหาด้านจริยธรรมและกฎหมายในการพัฒนา AI ในอนาคตวิธีการสร้างสมดุลระหว่างการพัฒนาทางวิทยาศาสตร์และเทคโนโลยีและการปกป้องทรัพย์สินทางปัญญาจะกลายเป็นหัวข้อสำคัญซึ่งต้องใช้ความพยายามร่วมกันทั้งในและนอกอุตสาหกรรมเพื่อหาแนวทางแก้ไข