لقد اجتذب نموذج إنشاء الفيديو Sora من OpenAI اهتمامًا واسع النطاق، حيث إن قدراته القوية في إنشاء الفيديو مذهلة، لكن مصدر بيانات التدريب الخاص به كان مربكًا. سوف تتعمق هذه المقالة في مصادر بيانات التدريب المحتملة لـ Sora، وخاصة الدور الذي تلعبه عمليات البث المباشر للعبة ومقاطع الفيديو الإستراتيجية، وتحلل المشكلات القانونية التي قد تنشأ وتأثيرها على تطوير الذكاء الاصطناعي في المستقبل.
لقد اجتذبت أداة توليد الفيديو Sora من OpenAI الكثير من الاهتمام منذ إطلاقها، ولكن مصدر التعلم منها كان دائمًا لغزًا. الآن، يبدو أن جانبًا من الغموض قد تم الكشف عنه: من المرجح أن تحتوي بيانات تدريب Sora على عدد كبير من عمليات البث المباشر للعبة ومقاطع الفيديو الإستراتيجية من Twitch!
يشبه Sora "سيد التقليد" الماهر، فهو قادر على إنشاء مقاطع فيديو يصل طولها إلى 20 ثانية باستخدام مطالبات نصية أو صور فقط، ويمكنه التحكم في نسب العرض إلى الارتفاع ودرجات الدقة المتعددة. في فبراير من هذا العام، عندما كشفت OpenAI لأول مرة عن Sora، ألمحت إلى أن نموذجها كان "يركز على التدريب" في فيديو "Minecraft". لذا، بالإضافة إلى "Minecraft"، ما هي كنوز اللعبة الأخرى المخفية في "أسرار الفنون القتالية" لسورا؟
وكانت النتائج مفاجئة، حيث يبدو أن سورا على دراية بمجموعة متنوعة من أنواع الألعاب. يمكنه إنشاء فيديو لعبة مستنسخة بظل "Mario"، على الرغم من وجود بعض "العيوب الطفيفة"؛ ويمكنه أيضًا محاكاة شاشة لعبة إطلاق نار مثيرة من منظور الشخص الأول، كما لو كانت "Call of Duty" و"Counter-Strike" "مدمجة"؛ ويمكنها أيضًا إعادة إنشاء مشاهد القتال في لعبة أركيد "Teenage Mutant Ninja Turtles" في التسعينيات، مما يجعل الناس يشعرون وكأنهم منغمسين في ذكريات الطفولة.
والأكثر إثارة للدهشة هو أن Sora يعرف أيضًا شكل البث المباشر على Twitch جيدًا، مما يعني أنه "شاهد" كمية كبيرة من محتوى البث المباشر. لم تلتقط لقطات شاشة الفيديو التي أنشأها Sora بدقة هيكل إطار البث المباشر فحسب، بل أعادت أيضًا بشكل واضح صورة المذيع الشهير Auronplay، بما في ذلك الوشم الموجود على ذراعه اليسرى.
ليس هذا فحسب، بل إن سورا "تعرف" أيضًا مذيعة Twitch أخرى، وهي Pokimane، وأنشأت مقطع فيديو لشخصية تشبهها. بالطبع، لتجنب مشكلات حقوق الطبع والنشر، قامت OpenAI بإعداد آلية تصفية لمنع Sora من إنشاء مقاطع فيديو تحتوي على أحرف مسجلة كعلامة تجارية.
على الرغم من أن OpenAI تلتزم الصمت بشأن مصدر بيانات التدريب الخاصة بها، إلا أن هناك دلائل تشير إلى أن محتوى اللعبة من المرجح أن يكون مدرجًا في مجموعة تدريب Sora. في مقابلة مع صحيفة وول ستريت جورنال في مارس، لم تنكر ميرا مولاتي، المديرة التنفيذية السابقة للتكنولوجيا في OpenAI، بشكل مباشر أن Sora استخدم محتوى من YouTube وInstagram وFacebook للتدريب. تعترف OpenAI أيضًا في المواصفات الفنية لـ Sora بأنها تستخدم البيانات "المتاحة للعامة" بالإضافة إلى البيانات المرخصة من مكتبات الوسائط مثل Shutterstock.
إذا تم استخدام محتوى اللعبة بالفعل لتدريب Sora، فقد يؤدي ذلك إلى سلسلة من المشكلات القانونية، خاصة عندما تقوم OpenAI بتطوير تجربة أكثر تفاعلية تعتمد على Sora. وأشار محامي الملكية الفكرية بريور كاشمان، جوشوا ويجنسبيرج، إلى أن الاستخدام غير المصرح به لمقاطع فيديو الألعاب لتدريب الذكاء الاصطناعي سيواجه مخاطر كبيرة، لأن تدريب نماذج الذكاء الاصطناعي يتطلب عادةً نسخ بيانات التدريب، وتحتوي مقاطع فيديو الألعاب على كمية كبيرة من المحتوى المحمي بحقوق الطبع والنشر.
تعتمد نماذج الذكاء الاصطناعي التوليدية مثل Sora على الاحتمالية. يتعلمون الأنماط من كميات كبيرة من البيانات ويقومون بالتنبؤات. تتيح لهم هذه القدرة "تعلم" كيفية عمل العالم. ولكن هناك أيضًا مخاطر مخفية، في ظل مطالبات معينة، قد يقوم النموذج بإنشاء محتوى مشابه جدًا لبيانات التدريب الخاصة به. وقد تسبب هذا في استياء شديد بين المبدعين الذين اعتقدوا أن أعمالهم استخدمت للتدريب دون إذن.
حاليًا، تتم مقاضاة Microsoft وOpenAI بسبب أدوات الذكاء الاصطناعي الخاصة بهما والتي يُزعم أنها تنسخ تعليمات برمجية مرخصة. كما واجهت شركات تطبيقات الذكاء الاصطناعي الفنية، مثل Midjourney وRunway وStability AI، اتهامات بانتهاك حقوق الفنانين. كما رفعت شركات الموسيقى الكبرى أيضًا دعاوى قضائية ضد شركتي Udio وSuno، وهما شركتان ناشئتان تطوران مولدات أغاني تعمل بالذكاء الاصطناعي.
لقد دافعت العديد من شركات الذكاء الاصطناعي منذ فترة طويلة عن مبادئ "الاستخدام العادل"، بحجة أن نماذجها تخلق أعمالا "تحويلية" بدلا من الانتحال. لكن محتوى اللعبة له خصائصه الخاصة. أشار إيفان إيفرست، محامي حقوق الطبع والنشر في شركة Dorsey & Whitney، إلى أن مقاطع فيديو الألعاب تتضمن طبقتين على الأقل من حماية حقوق الطبع والنشر: حقوق الطبع والنشر لمحتوى اللعبة المملوك لمطور اللعبة، وحقوق الطبع والنشر للفيديو الفريد الذي أنشأه اللاعب أو الفيديو منتج. بالنسبة لبعض الألعاب، قد يكون هناك أيضًا مستوى ثالث من الحقوق، وهو حقوق الطبع والنشر في المحتوى الذي ينشئه المستخدم.
على سبيل المثال، تسمح لعبة Fortnite للاعبين بإنشاء خرائط الألعاب الخاصة بهم ومشاركتها مع الآخرين. يشتمل فيديو الألعاب حول هذه الخرائط على ثلاثة مالكي حقوق الطبع والنشر على الأقل: Epic، واللاعبون، ومنشئو الخرائط. إذا قررت المحكمة أن التدريب النموذجي للذكاء الاصطناعي ينطوي على مسؤولية حقوق الطبع والنشر، فقد يصبح أصحاب حقوق الطبع والنشر هؤلاء مدعين محتملين أو مصادر معتمدة.
بالإضافة إلى ذلك، أشار Weigensberg أيضًا إلى أن اللعبة نفسها تحتوي أيضًا على العديد من العناصر "القابلة للحماية"، مثل مواد الملكية، والتي قد يأخذها القضاة في الاعتبار في دعاوى الملكية الفكرية.
في الوقت الحالي، لم يعلق العديد من استوديوهات الألعاب والناشرين بما في ذلك Epic وMicrosoft (التي تمتلك "Minecraft") وUbisoft وNintendo وRoblox ومطور "Cyberpunk 2077" CD Projekt Red على هذا الأمر.
وحتى لو فازت شركات الذكاء الاصطناعي بهذه النزاعات القانونية، فقد لا يتم إعفاء المستخدمين من المسؤولية. إذا قام النموذج التوليدي بنسخ عمل محمي بحقوق الطبع والنشر، فإن الشخص الذي ينشر العمل أو يدمجه في مشاريع أخرى قد يظل مسؤولاً عن انتهاك الملكية الفكرية.
لدى بعض شركات الذكاء الاصطناعي شروط تعويض للتعامل مع مثل هذه المواقف، ولكن عادة ما تكون هناك استثناءات. على سبيل المثال، تنطبق شروط OpenAI فقط على عملاء المؤسسات، وليس المستخدمين الأفراد. بالإضافة إلى ذلك، بالإضافة إلى مخاطر حقوق الطبع والنشر، هناك أيضًا مخاطر مثل انتهاكات العلامات التجارية، على سبيل المثال، قد يحتوي محتوى الإخراج على أصول مستخدمة للتسويق والعلامات التجارية، بما في ذلك الشخصيات داخل اللعبة.
ومع تزايد الاهتمام بالنماذج العالمية، قد يصبح الوضع أكثر تعقيدا. أحد تطبيقات النماذج العالمية هو إنشاء ألعاب فيديو واقعية، والتي يمكن أن تسبب مشكلات قانونية إذا كانت هذه الألعاب "الاصطناعية" مشابهة جدًا لما تم تدريب النموذج عليه.
وأشار أفيري ويليامز، محامي قضايا الملكية الفكرية في شركة ماكول سميث، إلى أن عناصر مثل الأصوات والحركات والشخصيات والأغاني والحوارات والأعمال الفنية المستخدمة لتدريب منصة الذكاء الاصطناعي في الألعاب تشكل انتهاكًا لحقوق الطبع والنشر. إن الأسئلة حول "الاستخدام العادل" التي أثيرت في العديد من الدعاوى القضائية المرفوعة ضد شركات الذكاء الاصطناعي المنتجة سيكون لها نفس التأثير على صناعة ألعاب الفيديو مثل الأسواق الإبداعية الأخرى.
يسلط نجاح Sora الضوء أيضًا على الإمكانات الهائلة لتكنولوجيا الذكاء الاصطناعي التوليدي في مجال إنشاء المحتوى، ولكنه يكشف أيضًا عن التحديات الهائلة التي تواجهها في استخدام البيانات وحقوق الملكية الفكرية. ستكون كيفية تحقيق التوازن بين الابتكار التكنولوجي وحماية الملكية الفكرية قضية رئيسية تحتاج إلى حل في التطوير المستقبلي للذكاء الاصطناعي. في المستقبل، سيخضع مصدر بيانات التدريب لنماذج الذكاء الاصطناعي وشرعيتها لتدقيق أكثر صرامة، مما سيكون له تأثير عميق على التطور المستقبلي لصناعة الذكاء الاصطناعي.