Recentemente, a empresa de detecção de plágio Copyleaks divulgou um relatório afirmando que até 60% do conteúdo gerado pelo modelo GPT-3.5 da OpenAI contém diferentes formas de plágio. O relatório levantou preocupações generalizadas sobre questões de direitos autorais e originalidade em modelos de IA. Copyleaks usa um método de pontuação autodesenvolvido que considera de forma abrangente fatores como similaridade de texto, pequenas alterações e interpretações. O relatório mostra que ciência da computação, física, psicologia e outras disciplinas têm maiores semelhanças, enquanto teatro, humanidades, inglês e outras disciplinas têm menores semelhanças. A OpenAI respondeu que tomou medidas para limitar a memória não intencional de modelos e proíbe explicitamente os usuários de reeditar deliberadamente o conteúdo.
A empresa de detecção de plágio Copyleaks divulgou recentemente um relatório afirmando que até 60% do conteúdo gerado pelo modelo de linguagem GPT-3.5 lançado pela OpenAI contém diferentes formas de plágio. Copyleaks usa um método de pontuação autodesenvolvido que considera vários fatores, como semelhança de texto, pequenas alterações e paráfrases, para determinar conteúdo semelhante como "plágio". Ciência da computação, física, psicologia e outras disciplinas têm as maiores semelhanças, enquanto teatro, humanidades e inglês têm menores semelhanças. A OpenAI afirmou que tomou várias medidas para limitar a memória não intencional, e os termos de uso também proíbem claramente os usuários de permitir deliberadamente que o modelo reprograme o conteúdo. Além disso, além da conhecida ação movida pelo New York Times, alguns criadores de conteúdo também estão tentando alegar que o modelo de IA foi treinado em seus trabalhos, portanto, o conteúdo que produz cópias aproximadas também deve receber um compartilhar.O relatório não apenas destaca os desafios dos modelos de IA na geração de conteúdo, mas também desencadeia discussões sobre uma série de questões legais e éticas, como direitos autorais de dados de treinamento de modelos de IA, originalidade de conteúdo e propriedade intelectual. promover o desenvolvimento saudável da tecnologia de IA.