最近、盗作検出会社 Copyleaks は、OpenAI の GPT-3.5 モデルによって生成されたコンテンツの最大 60% にさまざまな形式の盗作が含まれているというレポートを発表しました。この報告書は、AI モデルの著作権と独自性の問題について広く懸念を引き起こしました。 Copyleaks は、テキストの類似性、軽微な変更、解釈などの要素を総合的に考慮して独自に開発したスコアリング手法を使用しています。このレポートによると、コンピューターサイエンス、物理学、心理学などの科目の類似性は高い一方、演劇、人文科学、英語などの科目の類似性は低いことが示されています。 OpenAIは、モデルの意図しないメモリを制限する措置を講じており、ユーザーが意図的にコンテンツを再編集することを明示的に禁止していると応じた。
盗作検出会社 Copyleaks は最近、OpenAI によって開始された GPT-3.5 言語モデルによって生成されたコンテンツの最大 60% にさまざまな形式の盗作が含まれているというレポートを発表しました。 Copyleaks は、テキストの類似性、軽微な変更、言い換えなどの複数の要素を考慮して、類似したコンテンツを「盗作」と判断する独自に開発した採点方法を使用しています。コンピューターサイエンス、物理学、心理学などの科目の類似性が最も高く、演劇、人文科学、英語の類似性は低くなります。 OpenAIは、意図しないメモリを制限するためにさまざまな措置を講じていると述べ、また利用規約では、ユーザーが意図的にモデルにコンテンツの再プログラムを許可することを明確に禁止している。さらに、ニューヨーク・タイムズが起こした有名な訴訟に加えて、一部のコンテンツ作成者も、AIモデルが自分たちの作品でトレーニングされたと主張しようとしているため、近似コピーを作成したコンテンツにも罰則が与えられるべきです。共有。このレポートは、コンテンツ生成における AI モデルの課題を強調するだけでなく、AI モデルのトレーニング データの著作権、コンテンツの独創性、知的財産の所有権などの一連の法的および倫理的問題についての議論のきっかけにもなり、業界は共同で解決策を模索する必要があります。 AI技術の健全な発展を促進します。