تسببت Meta في جدل كبير بسبب أحدث مصدر بيانات تدريب Robot Llama3 AI للدردشة. وفقًا للملفات التي تم الكشف عنها ، يستخدم Meta مكتبة موقع الويب E -book القصيرة (Libgen) لتدريب Llama3 ، الذي أثار مخاوف واسعة النطاق بشأن حقوق الطبع والنشر وملكية البيانات. على الرغم من أن موظفي Meta الداخليين عبروا عن مخاوفهم بشأن استخدام مخاطر Libgen ، بما في ذلك المخاطر القانونية المحتملة والرأي العام السلبي ، لا يزال الرئيس التنفيذي Zuckerberg يوافق على هذا القرار ، ويسلط الضوء على الاستراتيجية الراديكالية لشركات التكنولوجيا الكبيرة في مسابقات الذكاء الاصطناعى وحقوق الطبع والنشر إلى حقوق الطبع والنشر.
في الآونة الأخيرة ، مع الكشف عن وثائق Meta في دعوى جماعية حول حقوق الطبع والنشر ، استخدمت الشركة مكتبة E -book مقرصنة تسمى Library Genesis (Libgen) لتدريب أحدث روبوت دردشة AI LAMA3 وقد اجتذبت اهتمامًا واسعًا. توضح هذه الملفات أن مهندسي Meta ناقشوا المخاطر المحتملة لاستخدام Libgen ، وهي "مكتبة الظل" ، وخاصة في سياق ملكية حقوق الطبع والنشر وملكية البيانات البارزة بشكل متزايد. على الرغم من التأثير السلبي المحتمل وخطر الرأي العام ، لا يزال مارك زوكربيرج ، الرئيس التنفيذي لشركة Meta ، يوافق على القرار.
بناءً على طلب المحكمة ، تم فك تشفير سجلات حوار Meta الداخلية لاستخدام مجموعة بيانات Libgen. من llama3. في رسالة بريد إلكتروني ، أشارت شركة Sony Theakanath ، مديرة إدارة المنتجات في META ، إلى أنه على الرغم من أن قرار استخدام Libgen قد أثار خطر الرأي العام ، فإن شركات الذكاء الاصطناعى الأخرى تستخدم أيضًا بيانات مماثلة ، مما يجعل فريق Meta يشعر بأن هذا الطريق ليس كذلك وحيد.
الأمر الأكثر إثارة للقلق هو أن موظفي Meta ناقشوا أيضًا كيفية معالجة وتصفية النص في Libgen لإزالة شعارات حقوق الطبع والنشر ، مثل ISBN وبيان حقوق الطبع والنشر. تنص المذكرة الداخلية على أن المواد التي توفرها Libgen هي "وثائق عالية الجودة وطويلة ، وهي مناسبة جدًا لتعلم المعرفة المهنية الخاصة". هذا يدل على أن Meta يبدو أنه يحاول إخفاء محتواه غير المصرح به.
بالإضافة إلى ذلك ، ذكر موظفو META أيضًا في البريد الإلكتروني أنه قد يكون من غير المناسب استخدام عنوان IP الخاص بالشركة لتنزيلات البذور بشكل مباشر والقلق التعبير عن هذا السلوك. ومع ذلك ، في غياب استخدام Zuckerberg لمجموعة بيانات Libgen ، تم الكشف عن عقلية Meta الفائزة في مسابقة الذكاء الاصطناعي. أثار هذا الحادث مرة أخرى الانتباه والشكوك حول قضايا شركات التكنولوجيا الكبيرة في قضايا حقوق الطبع والنشر.
قد يكون لنتائج الدعوى لحقوق الطبع والنشر هذه تأثير مهم على الحالات الأخرى المماثلة ، وخاصة استخدام الأعمال الإبداعية مثل الصور والموسيقى والأدب. مع زيادة الطلب على المحتوى الأصلي لشركات التكنولوجيا ، ستصبح حقوق ومصالح منشئي المحتوى الأصليين محور الاهتمام.
لم يعرض هذا الحادث فقط موقف Meta غير المسؤول عن قضايا حقوق الطبع والنشر ، ولكنه تسبب أيضًا في التفكير في القضايا الأخلاقية والقانونية في تطوير الذكاء الاصطناعي. في المستقبل ، ستصبح كيفية موازنة التنمية العلمية والتكنولوجية وحماية الملكية الفكرية موضوعًا مهمًا ، يتطلب جهودًا مشتركة داخل الصناعة وخارجها للبحث عن الحلول.