Meta CEO인 Mark Zuckerberg는 최근 법정에서 Meta가 저작권 데이터를 사용하여 AI를 훈련시키는 것을 법정에서 변호해 큰 관심을 끌었습니다. 이번 사건의 원고는 유명 작가들로, 메타가 AI 모델 훈련에 대량의 불법 복제 도서 데이터를 사용했다고 비난했다. Zuckerberg의 방어 전략은 상당히 논란의 여지가 있습니다. 그는 Meta의 행동이 의도적인 침해가 아니라는 것을 증명하기 위해 YouTube의 불법 복제 콘텐츠와 비교했습니다. 이러한 방어 전략이 법원에서 채택될지는 두고 볼 일입니다. 본 글에서는 주커버그의 증언과 사건의 최근 전개 상황을 자세히 분석하고, 그것이 인공지능 산업의 향후 발전에 미칠 영향을 살펴본다.
Meta CEO인 Mark Zuckerberg는 불법 복제 콘텐츠에 맞서는 YouTube의 싸움을 이용해 최근 법적 소송에서 회사가 AI 훈련에 저작권이 있는 데이터를 사용하는 것을 변호했습니다. "Kadrey v. Meta"라고 불리는 이 사건은 미국 법원에서 AI 회사를 상대로 제기된 많은 저작권 소송 중 하나입니다. 원고에는 유명 작가 Sarah Silverman과 Ta-Nahisi Coates가 포함되어 있습니다.
최근 공개된 Zuckerberg의 증언 발췌문에 따르면, 그는 일부 불법 복제 콘텐츠가 YouTube에 존재할 수 있지만 YouTube는 여전히 이를 제거하기 위해 노력하고 있다고 언급했습니다. "유튜브의 대부분의 콘텐츠는 합법적이어야 하며 관련 라이선스를 가지고 있어야 합니다."라고 Zuckerberg는 말했습니다. 이 발언은 Meta가 AI 교육을 위해 LibGen이라는 저작권이 있는 전자책 데이터 세트를 사용하는 것에 대한 그의 입장을 암시합니다.
LibGen은 Cengage Learning, McGraw-Hill 및 Pearson Education을 포함한 여러 출판사의 저작물을 제공하는 링크 집계 웹사이트입니다. 이 사이트는 저작권 침해로 여러 번 고소당했으며 수천만 달러의 벌금이 부과되었습니다. 법원 문서에 따르면 Meta의 AI 팀은 LibGen 사용의 법적 위험에 대한 우려를 표명했음에도 불구하고 Zuckerberg는 여전히 LibGen을 훈련 데이터 세트로 사용하는 것을 승인했습니다.
심문 과정에서 저커버그는 자신이 LibGen에 대해 잘 모른다고 주장하면서도 유튜브와 같은 플랫폼을 금지하는 것은 불합리하다고 말했다. "아니요. 일부 콘텐츠에는 저작권이 있을 수 있기 때문에 YouTube 사용자에 대한 정책을 설정하고 싶지 않습니다."라고 그는 말했습니다. 그는 또한 교육을 위해 저작권이 있는 자료를 사용할 때 Meta가 주의해야 한다는 점을 인정했습니다.
원고 측 변호사의 최근 주장에 따르면 Meta는 출판사와 라이센스 계약을 체결해야 하는지 여부를 결정하기 위해 라이센스가 가능한 저작권이 있는 도서와 LibGen의 특정 불법 복제 도서를 상호 참조했습니다. 또한 원고는 Meta가 최신 Llama 모델을 훈련할 때 LibGen의 데이터 세트를 사용하고 훈련을 위해 또 다른 불법 복제 소스인 Z-Library에서 전자책을 다운로드했다고 비난했습니다.
Z-Library 역시 저작권 문제로 여러 법적 소송을 당했고, 변호인들은 2022년 저작권 침해, 온라인 사기, 자금세탁 혐의로 기소됐다.
가장 밝은 부분:
Zuckerberg는 AI 교육에서 Meta의 저작권 자료 사용을 방어하기 위해 법정에서 YouTube 사례를 인용했습니다.
원고는 Meta가 불법 복제 도서 데이터 세트인 LibGen을 사용하여 Llama 모델을 훈련하고 관련 정보를 숨겼다고 비난했습니다.
메타는 다수의 저작권 소송에 직면해 있으며, 관련 법적 리스크로 인해 내부 논의와 우려가 촉발되었습니다.
이번 사건의 최종 판결은 인공지능 업계에 지대한 영향을 미칠 것입니다. 이는 향후 AI 기업이 저작권 데이터를 사용하여 모델을 교육하는 방법에 대한 중요한 법적 참고 자료를 제공하고 업계가 보다 엄격한 저작권 보호 조치를 개발하도록 촉발할 수 있습니다.