ล่าสุด New York Times และ Daily News ได้ยื่นฟ้อง OpenAI โดยกล่าวหาว่าใช้งานของตนในการฝึกอบรมโมเดล AI โดยไม่ได้รับอนุญาต คดีนี้เน้นไปที่ข้อเท็จจริงที่ว่าวิศวกร OpenAI ลบหลักฐานที่อาจมีความสำคัญต่อคดีโดยไม่ตั้งใจ ซึ่งทำให้เกิดความกังวลอย่างกว้างขวาง การเคลื่อนไหวนี้ไม่เพียงส่งผลกระทบต่อกระบวนการพิจารณาคดีเท่านั้น แต่ยังเผยให้เห็นถึงความเสี่ยงที่อาจเกิดขึ้นและปัญหาด้านจริยธรรมของการประมวลผลข้อมูลระหว่างการฝึกโมเดลภาษาขนาดใหญ่อีกด้วย บทความนี้จะวิเคราะห์เหตุการณ์นี้อย่างละเอียดและเจาะลึก และสำรวจผลกระทบที่มีต่อการพัฒนาอุตสาหกรรมปัญญาประดิษฐ์
เมื่อเร็ว ๆ นี้ The New York Times และ Daily News ได้ร่วมกันฟ้องร้อง OpenAI โดยกล่าวหาว่าใช้งานของตนเพื่อฝึกโมเดลปัญญาประดิษฐ์โดยไม่ได้รับอนุญาต
การพัฒนาคดีได้รับความสนใจจากสาธารณชน เนื่องจากทีมกฎหมายของโจทก์ชี้ให้เห็นในเอกสารของศาลล่าสุดว่าวิศวกรของ OpenAI ได้ลบหลักฐานที่อาจมีผลกระทบสำคัญต่อคดีนี้โดยไม่ได้ตั้งใจเมื่อประมวลผลข้อมูลที่เกี่ยวข้อง
มีรายงานว่า OpenAI ตกลงที่จะจัดหาเครื่องเสมือนสองเครื่องในฤดูใบไม้ร่วงนี้ เพื่อให้ทีมกฎหมายของโจทก์สามารถค้นหาข้อมูลการฝึกอบรมเพื่อหาเนื้อหาที่มีลิขสิทธิ์ เครื่องเสมือนคือคอมพิวเตอร์เสมือนที่ทำงานภายในระบบปฏิบัติการคอมพิวเตอร์ และโดยทั่วไปใช้สำหรับการทดสอบ การสำรองข้อมูล และการรันแอปพลิเคชัน ที่ปรึกษากฎหมายจาก The New York Times และ Daily News และผู้เชี่ยวชาญที่ได้รับการว่าจ้างได้ทำงานกับข้อมูลการฝึกอบรมของ OpenAI มานานกว่า 150 ชั่วโมงนับตั้งแต่วันที่ 1 พฤศจิกายน
อย่างไรก็ตาม เมื่อวันที่ 14 พฤศจิกายน วิศวกรของ OpenAI ได้ล้างข้อมูลการค้นหาที่จัดเก็บไว้ในเครื่องเสมือนเครื่องหนึ่งโดยไม่ตั้งใจ ตามจดหมายจากทนายความของโจทก์ในขณะที่ OpenAI พยายามกู้คืนข้อมูลที่สูญหายและประสบความสำเร็จในกรณีส่วนใหญ่ข้อมูลที่กู้คืนไม่สามารถนำมาใช้ระบุข่าวที่บทความของโจทก์เป็นได้เนื่องจากโครงสร้างโฟลเดอร์และชื่อไฟล์เป็น "ไม่สามารถกู้คืนได้" วิธีการใช้ในการฝึกอบรมโมเดล OpenAI
ที่ปรึกษากฎหมายของโจทก์ตั้งข้อสังเกตว่าพวกเขาไม่เชื่อว่าการลบออกนั้นมีเจตนา แต่เหตุการณ์ดังกล่าวแสดงให้เห็นว่า OpenAI นั้น "อยู่ในตำแหน่งที่ดีที่สุดในการค้นหาชุดข้อมูลของตนเองเพื่อหาเนื้อหาที่อาจละเมิด" ซึ่งหมายความว่า OpenAI ควรใช้เครื่องมือของตัวเองเพื่อค้นหาเนื้อหาที่ละเมิดที่เกี่ยวข้องได้อย่างมีประสิทธิภาพมากขึ้น
OpenAI ยืนยันในกรณีนี้และกรณีอื่นๆ ที่คล้ายกันว่าการใช้ข้อมูลที่เปิดเผยต่อสาธารณะสำหรับการฝึกโมเดลถือเป็นการใช้งานโดยชอบ ซึ่งหมายความว่า OpenAI เชื่อว่าไม่จำเป็นต้องจ่ายค่าลิขสิทธิ์สำหรับการใช้ตัวอย่างเหล่านี้ แม้ว่าจะสร้างรายได้จากโมเดลเหล่านี้ก็ตาม
เป็นมูลค่าการกล่าวขวัญว่า OpenAI ได้ลงนามข้อตกลงใบอนุญาตกับสื่อใหม่จำนวนมากขึ้น รวมถึง Associated Press, Business Insider, Financial Times ฯลฯ แต่ OpenAI ยังไม่ได้เปิดเผยข้อกำหนดเฉพาะของข้อตกลงเหล่านี้ มีรายงานว่า Dotdash พันธมิตรด้านเนื้อหาได้รับค่าตอบแทนรายปีอย่างน้อย 16 ล้านดอลลาร์สหรัฐ
แม้จะมีข้อพิพาททางกฎหมาย OpenAI ยังไม่ยืนยันหรือปฏิเสธการนำผลงานที่มีลิขสิทธิ์เฉพาะมาใช้กับการฝึกอบรม AI โดยไม่ได้รับอนุญาต
ไฮไลท์:
OpenAI ถูกกล่าวหาว่าลบหลักฐานที่อาจสำคัญในคดีลิขสิทธิ์โดยไม่ได้ตั้งใจ
ทนายความของโจทก์กล่าวว่าพวกเขาใช้เวลาและกำลังคนไปมากในการพยายามกู้คืนข้อมูล
OpenAI ยืนยันว่าการใช้ข้อมูลที่เปิดเผยต่อสาธารณะเพื่อฝึกอบรมโมเดลถือเป็นการใช้งานโดยชอบ
เหตุการณ์นี้เน้นย้ำถึงความซับซ้อนของแหล่งที่มาและปัญหาลิขสิทธิ์ของข้อมูลการฝึกอบรมโมเดลปัญญาประดิษฐ์ และยังทำให้เกิดข้อกังวลเกี่ยวกับความปลอดภัยของข้อมูลและการจัดการหลักฐาน พฤติกรรมของ OpenAI ถือเป็นการละเมิดหรือไม่ และวิธีกำหนดขอบเขตของ “การใช้งานโดยชอบธรรม” จะเป็นประเด็นสำคัญที่ต้องมีการหารือเพิ่มเติมในอนาคต ผลลัพธ์สุดท้ายของคดีนี้จะมีผลกระทบอย่างมากต่อการพัฒนาอุตสาหกรรมปัญญาประดิษฐ์