Récemment, la société de détection de plagiat Copyleaks a publié un rapport indiquant que jusqu'à 60 % du contenu généré par le modèle GPT-3.5 d'OpenAI contient différentes formes de plagiat. Le rapport a soulevé des inquiétudes généralisées concernant les problèmes de droits d’auteur et d’originalité dans les modèles d’IA. Copyleaks utilise une méthode de notation auto-développée qui prend en compte de manière exhaustive des facteurs tels que la similarité du texte, les modifications mineures et les interprétations. Le rapport montre que l'informatique, la physique, la psychologie et d'autres matières présentent des similitudes plus élevées, tandis que l'art dramatique, les sciences humaines, l'anglais et d'autres matières présentent des similitudes plus faibles. OpenAI a répondu qu'il avait pris des mesures pour limiter la mémoire involontaire des modèles et interdisait explicitement aux utilisateurs de rééditer délibérément le contenu.
La société de détection de plagiat Copyleaks a récemment publié un rapport indiquant que jusqu'à 60 % du contenu généré par le modèle de langage GPT-3.5 lancé par OpenAI contient différentes formes de plagiat. Copyleaks utilise une méthode de notation auto-développée qui prend en compte plusieurs facteurs tels que la similarité du texte, les modifications mineures et les paraphrases pour déterminer un contenu similaire comme étant du « plagiat ». L'informatique, la physique, la psychologie et d'autres matières présentent les similitudes les plus élevées, tandis que l'art dramatique, les sciences humaines et l'anglais présentent des similitudes moindres. OpenAI a déclaré avoir pris diverses mesures pour limiter la mémoire involontaire, et les conditions d'utilisation interdisent également clairement aux utilisateurs d'autoriser délibérément le modèle à reprogrammer le contenu. En outre, en plus du procès bien connu intenté par le New York Times, certains créateurs de contenu tentent également de prétendre que le modèle d'IA a été formé sur leurs œuvres, de sorte que le contenu qui produit des copies approximatives devrait également recevoir un partager.Le rapport met non seulement en évidence les défis des modèles d'IA dans la génération de contenu, mais déclenche également des discussions sur une série de questions juridiques et éthiques telles que les droits d'auteur sur les données de formation des modèles d'IA, l'originalité du contenu et la propriété intellectuelle. L'industrie doit explorer conjointement des solutions pour y remédier. promouvoir le développement sain de la technologie de l’IA.