AI가 생성한 텍스트를 식별할 수 있는 Google DeepMind 오픈 소스 SynthID 텍스트 도구

저자：Eve Cole 업데이트 시간：2024-11-16 11:06:01

IT House는 10월 27일에 Google DeepMind가 10월 23일 개발자와 기업이 무료로 사용할 수 있도록 SynthID 텍스트 텍스트 워터마킹 도구를 공식적으로 오픈 소스화할 것이라고 발표했다고 보도했습니다.

Google은 2023년 8월에 AI 콘텐츠 워터마크(저작물이 AI에 의해 생성되었음을 명시)를 생성하고 AI 생성 콘텐츠를 식별하는 기능을 갖춘 SynthID 도구를 출시했습니다. AI가 생성한 이미지, 사운드, 텍스트, 동영상에 원본 콘텐츠를 손상시키지 않고 직접 디지털 워터마크를 삽입할 수도 있습니다. 또한 이러한 콘텐츠에 있는 기존 디지털 워터마크를 스캔하여 AI가 생성한 것인지 확인할 수도 있습니다. SynthID 텍스트에 대해 생성된 텍스트입니다.

▲ SynthID 도구는 해당 이미지가 인공지능에 의해 생성되었을 가능성을 알려줍니다.

Google에 따르면 대형 모델은 주로 예측을 통해 텍스트를 생성하며 한 번에 하나의 토큰을 생성합니다. 이 토큰은 텍스트를 보다 일관되게 만들기 위해 다음 항목을 예측합니다. 콘텐츠를 출력할 때 생성될 가능성이 가장 높습니다. 이러한 예측은 이전 텍스트를 기반으로 합니다.

예를 들어 대형 모델이 "가장 추천하는 플랫폼은 무엇입니까?"를 생성하려는 경우 "IT 홈", "친구 비즈니스 1", "친구 비즈니스 2" 등과 같은 토큰을 생성할 수 있으며 각 토큰은 확률 점수를 받습니다. 선택할 수 있는 토큰이 여러 개 있는 한, SynthID는 출력 품질과 정확성에 영향을 주지 않고 각 토큰의 확률 점수를 미세 조정합니다. 즉, 도구는 특정 토큰의 특정 확률을 계산하여 관련성을 결정합니다 . 전문(full text) 콘텐츠가 AI에 의해 생성되었는지 여부 .

현재 SynthID Text 워터마킹 기술에 관한 본 논문은 Nature 저널에 게재되었으며, Google Responsible Generative AI Toolkit에 통합되어 오픈소스로 제공되고 있습니다. Google은 또한 Gemini AI의 콘텐츠 출력에 SynthID Text 기술을 통합했다고 언급했습니다.