메타는 원고가 LLAMA AI 모델을 훈련시키기 위해 불법 복제 된 전자 책 및 기사 데이터 세트의 사용을 개인적으로 승인했다고 원고가 CEO 인 Mark Zuckerberg를 비난하면서 매우 기대되는 저작권 침해 소송에 사로 잡혔습니다. 이 사례는 메타를 최전선으로 밀었을뿐만 아니라 AI 모델 교육에서 기술 거인의 저작권 사용에 대한 업계로부터 광범위한 관심을 끌었습니다. 이것은 승인없이 저작권이있는 작품을 사용하여 AI 모델을 훈련 한 혐의로 기소 된 여러 기술 회사에 대한 많은 저작권 소송 중 하나라는 점은 주목할 가치가 있습니다.
캘리포니아 북부 지역의 미국 지방 법원에 제출 된 최신 제출에 따르면, 원고는 작년 말 메타의 증언을 인용했으며, Zuckerberg는 Llama 모델을 훈련시키기 위해 Libgen이라는 데이터 세트의 사용을 승인했다고 명시 적으로 언급했습니다. Libgen은 "Link Aggregator"로서 많은 저작권이있는 학술 간행물을 제공합니다. 웹 사이트는 저작권 침해를 위해 소송을 제기하고 문을 닫았지만 Cengage Learning 및 McGraw Hill과 같은 주요 출판사로부터 메타의 침해를 촉진하는 작품을 계속 제공하고 있습니다.
이 문서는 또한 내부 메타 직원이 Libgen을 "알려진 불법화 데이터 세트"로 인정하고 회사의 규제 기관과의 협상 된 위치에 부정적인 영향을 줄 수 있음을 깨달았습니다. 더욱 충격적인 것은 Meta 엔지니어 Nikolay Bashlykov가 "저작권"및 "승인"과 같은 단어를 포함하여 Libgen 전자 책에서 저작권 정보를 삭제하기 위해 스크립트를 작성했다고 비난했다는 것입니다. 또한 Meta는 Scientific Journal 기사에서 저작권 태그와 소스 메타 데이터를 제거했다고 비난을 받았습니다. 둘 다 침해를 다루기위한 것입니다.
이 사건에서 가장 논란의 여지가있는 혐의는 Meta가 급류를 통해 Libgen 컨텐츠를 다운로드하고 이러한 불법 복제 된 저작권이있는 문서를 배포하는 데 도움이되었다는 것입니다. Torrenting은 네트워크 파일 배포 방법이며 다운로더는 파일을 업로드하는 동안 콘텐츠를 공유하고 있습니다. 원고의 변호사들은 메타가 실제로 급류에 관여함으로써 또 다른 형태의 저작권 침해를 수행했다고 지적했다. 메타 엔지니어들은 이에 대한 예약을 제공했지만,이 행동은 불법이라고 믿었지만, 메타는 발전기 AI의 책임자 인 Ahmad al-Dahle의 지원으로 계속 행동을 수행했습니다.
이 주장은 지난 4 월 뉴욕 타임즈 (New York Times)의 보고서와 일치하여 메타가 AI 데이터를 수집 할 때 코너를 삭감했다고 제안했다. 메타는 책 요약을 요약하기 위해 아프리카 계약자를 고용했으며 출판사 인 Simon Schuster를 인수하는 것으로 간주했습니다. 그러나 메타 경영진은 저작권 라이센스 협상이 너무 오래 걸리고 합리적인 사용의 원칙이 주요 방어가되었으며, 기술 회사의 비즈니스 윤리에 대한 의심을 불러 일으킨 태도입니다.
현재이 사건의 시험은 아직 결론을 내리지 않았으며 메타의 초기 라마 모델만이 관련되어 있습니다. 법원은 2023 년 AI와 관련된 몇 가지 저작권 소송을 기각했지만, 원고는 침해를 입증하지 못했다고 믿었지만,이 경우의 주장은 여전히 메타에 중대한 영향을 미칠 수 있습니다. 수요일 명령에 따르면, Vince Chabria 판사는 Meta의 대부분의 파일 삭제 요청을 거부했으며,이 파일의 삭제는 의심 할 여지없이 부정적인 홍보를 피하기위한 것이라고 지적했다 메타로 날려.
이 사건은 메타에 심각한 도전을 제기 할뿐만 아니라 기술 회사가 저작권이있는 작품을 사용하여 AI 모델을 훈련시키는 방법에 대한 광범위한 토론을 유발합니다. 특히 합리적인 사용과 저작권 보호 사이의 경계 문제에 대해이 사례는 향후 유사한 사례에 대한 중요한 참조가 될 수 있습니다. AI 기술의 빠른 발전으로 혁신과 저작권 보호 사이의 균형을 찾는 방법은 기술 회사와 법률 커뮤니티가 직면 한 중요한 문제가 될 것입니다.