โมเดลการสร้างวิดีโอ Sora ของ OpenAI ดึงดูดความสนใจอย่างกว้างขวาง ความสามารถในการสร้างวิดีโอที่ทรงพลังนั้นน่าทึ่งมาก แต่แหล่งข้อมูลการฝึกอบรมกลับสร้างความสับสน บทความนี้จะเจาะลึกแหล่งข้อมูลการฝึกอบรมที่เป็นไปได้ของ Sora โดยเฉพาะอย่างยิ่งบทบาทในการถ่ายทอดสดเกมและวิดีโอกลยุทธ์ และวิเคราะห์ปัญหาทางกฎหมายที่อาจเกิดขึ้นและผลกระทบต่อการพัฒนา AI ในอนาคต
Sora สิ่งประดิษฐ์การสร้างวิดีโอของ OpenAI ดึงดูดความสนใจอย่างมากนับตั้งแต่เปิดตัว แต่การเรียนรู้จากที่ใดยังคงเป็นปริศนามาโดยตลอด ตอนนี้ ส่วนหนึ่งของความลึกลับดูเหมือนจะถูกเปิดเผยแล้ว: ข้อมูลการฝึกซ้อมของ Sora น่าจะมีการถ่ายทอดสดเกมและวิดีโอกลยุทธ์จาก Twitch จำนวนมาก!
Sora เปรียบเสมือน "ปรมาจารย์ด้านการเลียนแบบ" ที่เชี่ยวชาญ สามารถสร้างวิดีโอที่มีความยาวสูงสุด 20 วินาทีโดยใช้เพียงข้อความหรือรูปภาพ และสามารถควบคุมอัตราส่วนภาพและความละเอียดได้หลายแบบ ในเดือนกุมภาพันธ์ของปีนี้ เมื่อ OpenAI เปิดตัว Sora เป็นครั้งแรก มันบอกเป็นนัยว่าโมเดลของมัน "มุ่งเน้นไปที่การฝึกฝน" ในวิดีโอ "Minecraft" นอกจาก "Minecraft" แล้ว ยังมีสมบัติในเกมอะไรอีกบ้างที่ซ่อนอยู่ใน "ความลับด้านศิลปะการต่อสู้" ของโซระ?
ผลลัพธ์ที่ได้นั้นน่าประหลาดใจ เนื่องจากดูเหมือนว่า Sora จะคุ้นเคยกับเกมประเภทต่างๆ เป็นอย่างดี มันสามารถสร้างวิดีโอเกมโคลนที่มีเงาของ "มาริโอ" แม้ว่าจะมี "ข้อบกพร่องเล็กน้อย" อยู่บ้าง แต่ก็สามารถจำลองหน้าจอเกมยิงมุมมองบุคคลที่หนึ่งที่น่าตื่นเต้นได้ราวกับว่า "Call of Duty" และ "Counter-Strike" เป็นการ "รวม" "; นอกจากนี้ยังสามารถสร้างฉากการต่อสู้ของเกมอาร์เคด "Teenage Mutant Ninja Turtles" ในปี 1990 ขึ้นมาใหม่ได้ ทำให้ผู้คนรู้สึกเหมือนกำลังจมอยู่ในความทรงจำในวัยเด็ก
สิ่งที่น่าแปลกใจยิ่งกว่านั้นก็คือ Sora ยังรู้จักรูปแบบการถ่ายทอดสดของ Twitch เป็นอย่างดี ซึ่งหมายความว่าได้ "ดู" เนื้อหาถ่ายทอดสดจำนวนมาก ภาพหน้าจอวิดีโอที่สร้างโดย Sora ไม่เพียงแต่บันทึกโครงสร้างเฟรมของการถ่ายทอดสดได้อย่างแม่นยำ แต่ยังช่วยฟื้นฟูภาพลักษณ์ของ Auronplay ผู้ประกาศข่าวชื่อดัง รวมถึงรอยสักบนแขนซ้ายของเขาด้วย
ไม่เพียงเท่านั้น โซระยัง "รู้จัก" ผู้ประกาศข่าว Twitch อีกคนชื่อ Pokimane และสร้างวิดีโอของตัวละครที่ดูคล้ายกับเธอ แน่นอน เพื่อหลีกเลี่ยงปัญหาลิขสิทธิ์ OpenAI ได้ตั้งค่ากลไกการกรองเพื่อป้องกันไม่ให้ Sora สร้างวิดีโอที่มีอักขระที่เป็นเครื่องหมายการค้า
แม้ว่า OpenAI จะไม่เปิดเผยแหล่งที่มาของข้อมูลการฝึก แต่ก็มีข้อบ่งชี้ว่าเนื้อหาเกมน่าจะรวมอยู่ในชุดการฝึกของ Sora ในการให้สัมภาษณ์กับ Wall Street Journal เมื่อเดือนมีนาคม Mira Mulati อดีต CTO ของ OpenAI ไม่ได้ปฏิเสธโดยตรงว่า Sora ใช้เนื้อหาจาก YouTube, Instagram และ Facebook ในการฝึกอบรม OpenAI ยังยอมรับในข้อกำหนดทางเทคนิคของ Sora ว่าใช้ข้อมูลที่ "เปิดเผยต่อสาธารณะ" รวมถึงข้อมูลที่ได้รับอนุญาตจากไลบรารีสื่อ เช่น Shutterstock
หากมีการใช้เนื้อหาเกมเพื่อฝึก Sora จริง ๆ สิ่งนี้อาจทำให้เกิดปัญหาทางกฎหมายหลายประการ โดยเฉพาะอย่างยิ่งเมื่อ OpenAI พัฒนาประสบการณ์เชิงโต้ตอบมากขึ้นโดยอิงจาก Sora Joshua Weigensberg ทนายความด้านทรัพย์สินทางปัญญาของ Pryor Cashman ชี้ให้เห็นว่าการใช้วิดีโอเกมเพื่อการฝึกอบรม AI โดยไม่ได้รับอนุญาตจะต้องเผชิญกับความเสี่ยงอย่างมาก เนื่องจากการฝึกอบรมโมเดล AI มักจะต้องมีการคัดลอกข้อมูลการฝึกอบรม และวิดีโอเกมมีเนื้อหาที่มีเนื้อหาที่ได้รับการคุ้มครองลิขสิทธิ์เป็นจำนวนมาก
โมเดล AI เชิงสร้างสรรค์ เช่น Sora ขึ้นอยู่กับความน่าจะเป็น พวกเขาเรียนรู้รูปแบบจากข้อมูลจำนวนมากและทำการคาดการณ์ ความสามารถนี้ทำให้พวกเขา "เรียนรู้" ว่าโลกทำงานอย่างไร แต่ก็มีอันตรายซ่อนอยู่เช่นกัน ภายใต้การแจ้งเตือนบางอย่าง โมเดลอาจสร้างเนื้อหาที่คล้ายกับข้อมูลการฝึกอย่างมาก สิ่งนี้ทำให้เกิดความไม่พอใจอย่างมากในหมู่ผู้สร้างซึ่งเชื่อว่าผลงานของพวกเขาถูกใช้เพื่อการฝึกอบรมโดยไม่ได้รับอนุญาต
ปัจจุบัน Microsoft และ OpenAI กำลังถูกฟ้องร้องเกี่ยวกับเครื่องมือ AI ที่ถูกกล่าวหาว่าคัดลอกรหัสลิขสิทธิ์ บริษัทแอปพลิเคชันงานศิลปะ AI เช่น Midjourney, Runway และ Stability AI ยังเผชิญกับข้อกล่าวหาเรื่องการละเมิดสิทธิ์ของศิลปินอีกด้วย บริษัทเพลงรายใหญ่ยังได้ยื่นฟ้อง Udio และ Suno ซึ่งเป็นสตาร์ทอัพที่พัฒนาเครื่องกำเนิดเพลงด้วย AI
บริษัท AI หลายแห่งได้โต้เถียงกันมานานแล้วเกี่ยวกับหลักการ "การใช้งานโดยชอบธรรม" โดยอ้างว่าโมเดลของพวกเขาสร้างผลงานที่ "เปลี่ยนแปลง" มากกว่าที่จะเป็นการลอกเลียนแบบ แต่เนื้อหาของเกมก็มีลักษณะเฉพาะของตัวเอง Evan Everest ทนายความด้านลิขสิทธิ์ของ Dorsey & Whitney ชี้ให้เห็นว่าวิดีโอเกมเกี่ยวข้องกับการคุ้มครองลิขสิทธิ์อย่างน้อยสองชั้น: ลิขสิทธิ์ของเนื้อหาเกมที่เป็นของผู้พัฒนาเกม และลิขสิทธิ์ของวิดีโอเฉพาะที่สร้างโดยผู้เล่นหรือวิดีโอ ผู้ผลิต สำหรับเกมบางเกม อาจมีสิทธิ์ระดับที่สามด้วย กล่าวคือ ลิขสิทธิ์ในเนื้อหาที่ผู้ใช้สร้างขึ้น
ตัวอย่างเช่น Fortnite อนุญาตให้ผู้เล่นสร้างแผนที่เกมของตัวเองและแบ่งปันกับผู้อื่น วิดีโอเกมเกี่ยวกับแผนที่เหล่านี้เกี่ยวข้องกับเจ้าของลิขสิทธิ์อย่างน้อยสามคน ได้แก่ Epic เกมเมอร์ และผู้สร้างแผนที่ หากศาลตัดสินว่าการฝึกอบรมโมเดล AI เกี่ยวข้องกับความรับผิดด้านลิขสิทธิ์ เจ้าของลิขสิทธิ์เหล่านี้อาจกลายเป็นโจทก์หรือแหล่งที่มาที่ได้รับอนุญาต
นอกจากนี้ Weigensberg ยังชี้ให้เห็นว่าตัวเกมยังมีองค์ประกอบ "ที่สามารถป้องกันได้" หลายอย่าง เช่น พื้นผิวที่เป็นกรรมสิทธิ์ ซึ่งผู้พิพากษาอาจพิจารณาในการดำเนินคดีเกี่ยวกับทรัพย์สินทางปัญญา
ปัจจุบัน สตูดิโอเกมและผู้จัดพิมพ์หลายแห่ง รวมถึง Epic, Microsoft (ซึ่งเป็นเจ้าของ Minecraft), Ubisoft, Nintendo, Roblox และ Cyberpunk 2077 ผู้พัฒนา CD Projekt Red ยังไม่ได้ให้ความเห็นเกี่ยวกับเรื่องนี้
แม้ว่าบริษัท AI จะชนะข้อพิพาททางกฎหมายเหล่านี้ ผู้ใช้ก็อาจไม่ได้รับการยกเว้นจากความรับผิด หากโมเดลกำเนิดคัดลอกงานที่มีลิขสิทธิ์ บุคคลที่เผยแพร่งานหรือรวมงานนั้นเข้ากับโครงการอื่นอาจยังคงต้องรับผิดต่อการละเมิดทรัพย์สินทางปัญญา
บริษัท AI บางแห่งมีข้อกำหนดการชดเชยเพื่อจัดการกับสถานการณ์ดังกล่าว แต่มักจะมีข้อยกเว้น ตัวอย่างเช่น ข้อกำหนดของ OpenAI มีผลกับลูกค้าองค์กรเท่านั้น ไม่ใช่ผู้ใช้รายบุคคล นอกจากนี้ นอกเหนือจากความเสี่ยงด้านลิขสิทธิ์แล้ว ยังมีความเสี่ยง เช่น การละเมิดเครื่องหมายการค้า เช่น เนื้อหาที่ส่งออกอาจมีเนื้อหาที่ใช้สำหรับการตลาดและการสร้างแบรนด์ รวมถึงตัวละครในเกม
เมื่อความสนใจในโมเดลโลกเพิ่มมากขึ้น สถานการณ์ก็อาจมีความซับซ้อนมากขึ้น การประยุกต์ใช้โมเดลโลกอย่างหนึ่งคือการสร้างวิดีโอเกมในชีวิตจริง ซึ่งอาจทำให้เกิดปัญหาทางกฎหมายได้หากเกม "สังเคราะห์" เหล่านี้มีความคล้ายคลึงกับโมเดลที่ได้รับการฝึกฝนมากเกินไป
Avery Williams ทนายความคดีทรัพย์สินทางปัญญาของ McKool Smith ชี้ให้เห็นว่าองค์ประกอบต่างๆ เช่น เสียง การเคลื่อนไหว ตัวละคร เพลง บทสนทนา และงานศิลปะที่ใช้ในการฝึกแพลตฟอร์ม AI ในเกมถือเป็นการละเมิดลิขสิทธิ์ คำถามเกี่ยวกับ “การใช้งานโดยชอบธรรม” ที่เกิดขึ้นในการฟ้องร้องบริษัท AI จำนวนมากจะมีผลกระทบต่ออุตสาหกรรมวิดีโอเกมเช่นเดียวกับตลาดสร้างสรรค์อื่นๆ
ความสำเร็จของ Sora ยังเน้นย้ำถึงศักยภาพมหาศาลของเทคโนโลยี generative AI ในด้านการสร้างเนื้อหา แต่ยังเผยให้เห็นความท้าทายครั้งใหญ่ในการใช้ข้อมูลและสิทธิ์ในทรัพย์สินทางปัญญา การสร้างสมดุลระหว่างนวัตกรรมทางเทคโนโลยีและการคุ้มครองทรัพย์สินทางปัญญาจะเป็นประเด็นสำคัญที่ต้องแก้ไขในการพัฒนา AI ในอนาคต ในอนาคตแหล่งที่มาของข้อมูลการฝึกอบรมสำหรับโมเดล AI และความถูกต้องตามกฎหมายจะต้องได้รับการตรวจสอบอย่างเข้มงวดมากขึ้น ซึ่งจะมีผลกระทบอย่างมากต่อการพัฒนาอุตสาหกรรม AI ในอนาคต