최근 표절 탐지 회사인 Copyleaks는 OpenAI의 GPT-3.5 모델로 생성된 콘텐츠의 최대 60%에 다양한 형태의 표절이 포함되어 있다는 보고서를 발표했습니다. 이 보고서는 AI 모델의 저작권 및 독창성 문제에 대한 광범위한 우려를 제기했습니다. Copyleaks는 텍스트 유사성, 사소한 변경, 해석 등의 요소를 종합적으로 고려하는 자체 개발한 채점 방식을 사용합니다. 보고서에 따르면 컴퓨터공학, 물리학, 심리학 등의 과목은 유사성이 높은 반면 드라마, 인문학, 영어 등의 과목은 유사성이 낮은 것으로 나타났다. OpenAI는 의도하지 않은 모델 메모리를 제한하는 조치를 취했으며 사용자가 의도적으로 콘텐츠를 다시 편집하는 것을 명시적으로 금지했다고 응답했습니다.
표절 탐지 회사인 Copyleaks는 최근 OpenAI가 출시한 GPT-3.5 언어 모델로 생성된 콘텐츠의 최대 60%에 다양한 형태의 표절이 포함되어 있다는 보고서를 발표했습니다. Copyleaks는 텍스트 유사성, 사소한 변경, 의역 등 여러 요소를 고려하여 자체 개발한 채점 방법을 사용하여 유사한 콘텐츠를 "표절"로 판단합니다. 컴퓨터공학, 물리학, 심리학 등의 과목은 유사성이 가장 높은 반면, 드라마, 인문학, 영어는 유사성이 낮습니다. OpenAI는 의도하지 않은 메모리를 제한하기 위해 다양한 조치를 취했다고 밝혔으며, 이용 약관에서도 사용자가 모델이 의도적으로 콘텐츠를 재프로그래밍하도록 허용하는 것을 분명히 금지하고 있습니다. 게다가 뉴욕타임즈가 제기한 잘 알려진 소송 외에도 일부 콘텐츠 창작자들도 자신의 작품에 대해 AI 모델이 훈련됐다고 주장하고 있기 때문에 대략적인 카피를 생산하는 콘텐츠에도 가산점을 부여해야 한다. 공유하다.이 보고서는 콘텐츠 생성에서 AI 모델의 과제를 강조할 뿐만 아니라 AI 모델 훈련 데이터 저작권, 콘텐츠 독창성, 지적 재산권 소유권과 같은 일련의 법적, 윤리적 문제에 대한 논의를 촉발합니다. AI 기술의 건전한 발전을 촉진합니다.