近日,抄襲檢測公司Copyleaks發布報告,指出OpenAI的GPT-3.5模型生成內容中高達60%有不同形式的抄襲。該報告引發了人們對AI模型版權和原創性問題的廣泛關注。 Copyleaks採用自主研發的評分方法,綜合考量文本相似度、微小改動和釋義等因素進行判斷。報告顯示,電腦科學、物理、心理學等學科的相似度較高,而戲劇、人文學科、英語等學科則較低。 OpenAI回應表示已採取措施限制模型無意記憶,並明確禁止使用者故意進行內容反編。
抄襲檢測公司Copyleaks最近發布報告指出,OpenAI推出的GPT-3.5大語言模型生成內容中,高達60%含有不同形式的抄襲。 Copyleaks使用自主開發的評分方法,考慮文本相似度、微小改動、釋義等多方面因素將相似內容判定為「抄襲」。電腦科學、物理學、心理學等學科的相似度最高,而戲劇、人文學科、英語的相似度較低。 OpenAI表示已經採取各種措施限制無意記憶,使用條款也明確禁止使用者故意讓模型反編內容。此外,除了紐約時報提起的知名訴訟案,一些內容創作者也試圖主張AI模型就是在他們的作品上得到訓練的,所以產出近似副本內容也應該給予分成。該報告不僅凸顯了AI模型在內容生成方面的挑戰,也引發了關於AI模型訓練資料版權、內容原創性以及知識產權歸屬等一系列法律和倫理問題的討論,需要業界共同探索解決方案,以促進AI科技的健康發展。