최근 언론에서는 엔비디아가 자사의 AI 모델을 훈련하기 위해 유튜브 영상 데이터를 대규모로 몰래 빼돌렸다고 폭로해 광범위한 법적, 윤리적 논란이 촉발됐다. 이번 움직임에는 코스모스(Cosmos) 딥러닝 모델, 자율주행 알고리즘 등 엔비디아의 AI 제품이 다수 포함됐다. 데이터 획득 방식은 영상 제작자와 구글의 승인 없이 숨겨져 있다. 내부 NVIDIA 이메일에 따르면 고위 경영진은 이러한 행동에 대해 낙관적이며 "완전히 승인"되었다고 믿고 있습니다. 이 진술은 이러한 행동이 플랫폼의 서비스 약관을 위반한다는 것을 분명히 밝힌 Google의 공식 성명과 상반됩니다. 관련된 엄청난 양의 데이터, 은밀한 운영 방법, 모든 당사자의 전혀 다른 반응으로 인해 이번 사건이 우려되었습니다.
최근 데이터 수집 분야에서 거대 기술 기업 엔비디아(Nvidia)의 비밀 작전이 드러났습니다. 미디어 404의 보도에 따르면, Nvidia는 법과 윤리 측면에서 상당히 모호한 엄청난 양의 YouTube 동영상 데이터를 수집하여 인공 지능 모델을 훈련했습니다.
보고서는 엔비디아가 코스모스 딥 러닝 모델, 자율 주행 알고리즘, 디지털 인간 AI 아바타 제품, 3D 세계 구축 도구 옴니버스(Omniverse) 등 다양한 AI 모델을 훈련하기 위해 이러한 비디오 데이터를 사용하고 있다고 지적했습니다.
Nvidia는 YouTube에서 발견되는 것을 피하기 위해 여러 개의 "가상 머신"을 사용하고 지속적으로 IP 주소를 변경하는 등 데이터 스크래핑 동작을 은폐하기 위해 많은 은밀한 조치를 취한 것으로 이해됩니다. 또한 동영상 제작자이자 YouTube 모회사인 Google은 이러한 데이터 스크랩 활동을 승인하지 않았습니다. Nvidia의 내부 커뮤니케이션은 그들의 전략이 매우 대담하다는 것을 보여줍니다. 한 임원은 이메일에서 매일 인간의 삶과 동등한 시각적 경험 데이터를 생성할 수 있는 "비디오 데이터 공장"을 구축하고 있다고 언급했습니다.
흥미롭게도 직원들이 그러한 데이터 수집의 합법성과 윤리성에 대해 우려를 표명했을 때 경영진은 이 모든 것이 고위급 결정이라고 믿으며 매우 자신감 있는 모습을 보였습니다. 이메일에는 "우리는 모든 데이터에 대해 포괄적인 승인을 받았습니다"라고 적혀 있습니다.
더욱 문제가 되는 것은 Nvidia가 원래 학술 연구를 위해 생성된 1억 3천만 개의 YouTube 동영상이 포함된 HD-VG-130M 데이터 세트를 사용하고 있다는 사실을 한동안 알고 있었다는 것입니다. 이에 대해 많은 전문가들은 연구에 활용되는 데이터의 상용화가 부적절하다며 강한 불만을 표시해 왔다.
NVIDIA는 AI 산업의 핵심 플레이어로서 시장에서 탁월한 위치를 차지하고 있으며 NVIDIA의 그래픽 처리 장치(GPU)는 많은 컴퓨팅 집약적 AI 시스템의 기반입니다. OpenAI, Microsoft, Google 등 Nvidia와 협력하는 회사들은 이러한 행동에 대해 우려를 표명했습니다. 구글 대변인은 허가 없이 유튜브 데이터를 사용하는 것은 플랫폼 서비스 약관을 명백히 위반하는 것이라고 언급했습니다.
언론에 대한 반응으로 엔비디아는 그들의 AI 훈련 관행이 "저작권법의 정신과 조항을 완전히 준수한다"고 주장했습니다. 그런데 이 콘텐츠를 사용하는 창작자들은 이 발언에 대해 어떻게 생각할까요?
가장 밝은 부분:
엔비디아는 AI 훈련을 위해 대량의 유튜브 영상 데이터를 비밀리에 스크랩해 법적, 윤리적 문제에 대한 우려를 불러일으켰다.
내부 이메일에 따르면 Nvidia 경영진은 이러한 행동이 완전히 승인되었다고 믿었으며 그들의 태도는 매우 대담했습니다.
구글은 허가 없이 유튜브 데이터를 사용하는 것은 플랫폼의 서비스 약관을 명백히 위반했다고 지적했고, 엔비디아의 대응은 논란을 불러일으켰다.
NVIDIA의 데이터 스크래핑 행위는 AI 데이터 수집의 윤리 및 법률에 대한 광범위한 논의를 촉발시켰으며, 이에 대한 대응은 논란을 잠재우지 못했습니다. 이번 사건은 데이터 사용과 관련하여 대규모 기술 기업이 직면한 과제와 관련 법률 및 규정 개선의 시급한 필요성을 강조합니다. 앞으로도 유사한 사건이 계속해서 관심을 끌고 업계가 자율성을 강화하고 데이터 사용 행동을 표준화하도록 촉구할 수 있습니다.