في الآونة الأخيرة، أصدرت شركة Copyleaks للكشف عن الانتحال تقريرًا يشير إلى أن ما يصل إلى 60% من المحتوى الناتج عن نموذج GPT-3.5 الخاص بـ OpenAI يحتوي على أشكال مختلفة من الانتحال. أثار التقرير مخاوف واسعة النطاق بشأن قضايا حقوق النشر والأصالة في نماذج الذكاء الاصطناعي. تستخدم Copyleaks طريقة تسجيل تم تطويرها ذاتيًا وتأخذ في الاعتبار عوامل مثل تشابه النص والتغييرات الطفيفة والتفسيرات بشكل شامل. ويظهر التقرير أن علوم الكمبيوتر والفيزياء وعلم النفس وغيرها من المواضيع لديها أوجه تشابه أعلى، في حين أن الدراما والعلوم الإنسانية واللغة الإنجليزية وغيرها من المواضيع لديها أوجه تشابه أقل. وردت شركة OpenAI بأنها اتخذت تدابير للحد من الذاكرة غير المقصودة للنماذج وتمنع المستخدمين صراحةً من إعادة تحرير المحتوى عمدًا.
أصدرت شركة Copyleaks للكشف عن الانتحال مؤخرًا تقريرًا يشير إلى أن ما يصل إلى 60% من المحتوى الناتج عن نموذج اللغة GPT-3.5 الذي أطلقته OpenAI يحتوي على أشكال مختلفة من الانتحال. تستخدم Copyleaks طريقة تسجيل تم تطويرها ذاتيًا وتأخذ في الاعتبار عوامل متعددة مثل تشابه النص والتغييرات الطفيفة وإعادة الصياغة لتحديد المحتوى المشابه باعتباره "انتحالًا". علوم الكمبيوتر والفيزياء وعلم النفس وغيرها من المواضيع لديها أعلى التشابه، في حين أن الدراما والعلوم الإنسانية واللغة الإنجليزية لديها أوجه تشابه أقل. ذكرت OpenAI أنها اتخذت تدابير مختلفة للحد من الذاكرة غير المقصودة، كما تحظر شروط الاستخدام بوضوح على المستخدمين السماح للنموذج عمدًا بإعادة برمجة المحتوى. بالإضافة إلى ذلك، بالإضافة إلى الدعوى القضائية المعروفة التي رفعتها صحيفة نيويورك تايمز، يحاول بعض منشئي المحتوى أيضًا الادعاء بأن نموذج الذكاء الاصطناعي تم تدريبه على أعمالهم، لذا يجب أيضًا إعطاء المحتوى الذي ينتج نسخًا تقريبية يشارك.لا يسلط التقرير الضوء على تحديات نماذج الذكاء الاصطناعي في إنشاء المحتوى فحسب، بل يثير أيضًا مناقشات حول سلسلة من القضايا القانونية والأخلاقية مثل حقوق الطبع والنشر لبيانات التدريب على نماذج الذكاء الاصطناعي، وأصالة المحتوى، وملكية الملكية الفكرية تعزيز التنمية الصحية لتكنولوجيا الذكاء الاصطناعي.