OpenAI가 새롭게 출시한 AI 영상 생성 모델 소라(Sora)는 실감나는 영상 생성 능력이 놀랍지만, 훈련 데이터 출처에 대한 논란도 불러일으켰다. 오픈AI 최고기술책임자(CTO)는 소라가 훈련에 공개 데이터를 사용한 사실을 인정하면서도, 여기에 유튜브 등 플랫폼의 데이터가 포함됐는지 여부를 밝히지 않아 대중의 우려를 불러일으켰다. Sora의 놀라운 성능은 비디오 품질 및 세부 처리의 추가 개선과 같은 개선의 여지도 드러냈습니다.
OpenAI의 최신 성과인 Sora는 훈련 데이터의 출처에 대해 대중들 사이에서 논란을 불러일으켰습니다. 최고기술책임자(CTO)는 소라가 공공 데이터에 대한 교육을 받았지만 유튜브 등 데이터를 활용할지는 미지수라고 밝혔다. 소라가 제작한 영상은 현실에 가깝고 개선이 필요합니다. OpenAI는 학습 데이터 소스 문제를 해결하고 대중의 우려를 불러일으키기 위해 오디오 생성 기능을 추가할 계획입니다.
앞으로 OpenAI는 소라에 오디오 생성 기능을 추가해 영상의 몰입도를 높일 뿐만 아니라, 데이터 소스에 대한 대중의 우려를 부분적으로 완화할 수도 있을 것으로 예상된다. 그러나 기술 개발과 데이터 윤리의 균형을 맞추는 방법은 OpenAI가 직면한 주요 과제로, 보다 투명하고 책임감 있는 AI 모델 교육 방법에 대한 지속적인 관심과 탐구가 필요합니다.