AI 생성 기술이 나날이 발전함에 따라 AI가 생성한 이미지와 영상이 점점 더 현실감 있게 인터넷에 넘쳐나면서 사람들이 진위 여부를 구별하기 어렵게 만들고 있습니다. AI 생성 콘텐츠를 식별하는 것이 시급한 요구가 되었습니다. 최근 '큐빗' B국 영상에서는 AI 기술을 활용해 AI가 생성한 영상을 식별하는 방법을 논의해 큰 관심을 끌었고, 조회수 168만 회를 돌파하며 AI 식별 AI 기술에 대한 뜨거운 논의가 촉발됐다.
AI가 만들어내는 이미지가 점점 더 현실적으로 변하면서 많은 사람들은 영상을 볼 때 '이게 정말 찍은 것인가? 아니면 AI의 걸작인가?'라는 생각을 하지 않을 수 없다.
최근 Qubit이 Bilibili에 게시한 작업은 AI를 사용하여 AI 동영상을 식별하는 방법을 논의하면서 열띤 토론을 불러일으켰으며 조회수는 즉시 168만 회를 초과했습니다. AI가 어떻게 AI를 한눈에 식별할 수 있는지 살펴보겠습니다.
영상에서는 AI 영상을 육안으로 식별하는 몇 가지 팁을 소개한다. 예를 들어 캐릭터가 부자연스러운 움직임이나 표정을 짓고 있는지, 말을 할 때 목소리와 입 모양, 감정이 조화를 이루고 있는지 주목해보세요. 하지만 대용량 영상 앞에서 인력만으로는 턱없이 부족하고, 이때 AI가 필요하다.
AI는 얼굴이 바뀌는 동영상을 식별하는 데 있어 고유한 이점을 가지고 있습니다. AI 얼굴 변경 기술은 일반적으로 합성된 부분을 프레임별로 원본 비디오에 연결합니다. 인간의 눈은 이상한 점만 발견할 수 있지만 AI는 이러한 접합 흔적을 정확하게 찾을 수 있습니다. 모든 사람에게 고유한 지문이 있듯이, 서로 다른 영상의 조명, 질감, 기타 정보를 완벽하게 복사하는 것은 어렵습니다. 이러한 미묘한 차이가 AI 인식의 핵심입니다.
전적으로 AI로 생성된 동영상의 경우 인식 방법이 더 복잡합니다. 연구팀은 모델 특징, 모션 특징, 기하학적 단안 깊이 특징의 3가지 차원에서 세 가지 분류기를 훈련했습니다. 소라가 생성한 영상을 예로 들면, 사람과 동물의 불안정한 숫자, 물체 이동 시 비정상적인 색상과 그림자 변화, 카메라 이동 시 원근 및 비율 오류 등이 모두 AI 인식에 중요한 단서가 됐다.
더욱 흥미롭게도 연구원들은 DIVID라는 새로운 방법도 발견했습니다. AI 영상과 실제 영상을 확산 모델로 재생산하면 결과가 매우 달라질 것이라는 사실을 발견했다. AI가 생성한 비디오 픽셀은 훈련 데이터의 평균에 가까운 경향이 있는 반면, 인간이 만든 비디오는 다양한 측면에서 명확한 개성을 보여줍니다. 이 기능을 기반으로 개발된 DIVID 알고리즘은 소라가 생성한 영상을 식별할 때 최대 93.7%의 정확도를 갖는다.
이러한 AI 식별 방법의 출현은 의심할 여지 없이 우리에게 허위 정보 확산에 맞서는 강력한 무기를 제공했습니다. 디지털 세상의 예리한 눈과 같아서 정보의 바다에서 진실과 거짓을 구별할 수 있도록 도와줍니다.
AI 식별 기술의 발전은 우리에게 허위 정보에 맞서 싸울 수 있는 새로운 무기를 제공하며, 앞으로도 정보 식별 기술의 지속적인 발전과 개선을 예고하여 정보화 시대에 사람들이 보다 명확한 이해를 가질 수 있게 해줄 것입니다.