이 기사에서는 Llama3 개발 과정에서 Meta 내부 경쟁의 강도와 그로 인한 잠재적인 저작권 문제에 대해 설명합니다. 법원이 공개한 내부 정보를 통해 메타는 저작권 문제가 있을 수 있는 훈련 데이터를 사용하는 데에도 위험을 무릅쓰고 OpenAI와 Anthropic을 능가하기 위해 많은 노력을 기울였음을 알 수 있습니다. 이 글에서는 Meta의 내부 경쟁 상황, 경쟁사에 대한 태도, 그에 따른 법적 위험 및 향후 전망에 대한 자세한 분석을 제공할 것입니다.
메타가 진행 중인 인공지능 저작권 소송 중 하나인 카드레이 대 메타(Kadrey v. Meta) 사건에서 법원이 공개한 내부 정보에 따르면 회사의 치열한 경쟁과 라마3(Llama3) 개발 시 잠재적인 저작권 문제가 드러났다. Meta의 고위 리더와 연구원은 AI 모델 개발에서 OpenAI 및 Anthropic과 같은 회사를 능가하기 위해 최선을 다했으며 GPT-4 및 Claude를 그들의 노력에 대한 표준으로 간주합니다.
치열한 경쟁심리: Meta, OpenAI를 물리치겠다고 다짐
Meta의 Generative AI 부사장인 Ahmad Al-Dahle에 따르면, Llama3를 개발할 때 회사의 목표는 분명히 GPT-4를 향한 것이며, 다음과 같은 효율적인 하드웨어 지원을 통해 AI 경쟁에서 우위를 점하기로 결정했습니다. 64k GPU. Al-Dahle은 내부 메시지에서 다음과 같이 썼습니다. "우리는 64k GPU를 출시할 것입니다! 우리는 최첨단 기술을 구축하고 이 게임에서 승리하는 방법을 배워야 합니다."
그러나 Meta가 오픈 소스 AI 모델을 출시하더라도 Meta 경영진은 일반적으로 모델의 가중치를 공개하지 않는 OpenAI 및 Anthropic과 같은 경쟁사를 물리치는 데 더 집중하고 대신 모델을 API 아래에 배치하여 경쟁의 강력한 초점을 형성합니다.
미스트랄과 내부 불안에 대한 경멸
프랑스 인공지능 스타트업 미스트랄(Mistral)은 메타의 가장 큰 공개 경쟁자 중 하나이지만 메타 경영진은 이를 분명히 무시하고 있다. 한 메시지에서 Al-Dahle은 "Mistral은 우리에게 중요하지 않습니다. 우리는 더 잘할 수 있어야 합니다." 이는 또한 AI 경쟁과 업계에서의 역할에 대한 Meta 내부의 극도의 불안을 드러냈습니다.
동시에 Meta의 AI 리더들은 내부 커뮤니케이션에서 Llama3를 교육하기 위해 데이터를 적극적으로 얻는 방법에 대해 자주 이야기했으며 일부 정보에 따르면 경영진은 Llama3에 대한 기대가 가득 차 있었습니다. 한 임원은 메시지에서 "Llama3 그게 전부입니다. 신경쓰세요.”
저작권 문제 및 법적 문제
메타가 라마3 개발 과정에서 치열한 경쟁을 벌이면서, 메타가 활용한 훈련 데이터도 법적 분쟁을 일으키기 시작했다. 검찰은 메타 경영진이 AI 개발 진행 상황을 따라잡기 위해 노력하면서 저작권이 있는 도서를 훈련 데이터로 사용했을 가능성이 있다고 주장합니다.
연구원 Hugo Touvron은 메시지를 통해 Llama2 훈련에서 Meta가 사용하는 데이터 세트의 조합이 "끔찍하다"고 밝혔으며 데이터 세트를 개선하여 Llama3를 최적화할 것을 제안했습니다. 그들은 또한 Cengage Learning, Macmillan Learning, McGraw Hill 및 Pearson Education과 같은 출판사의 저작권이 있는 저작물이 포함된 LibGen 데이터 세트 사용에 대한 장벽을 제거하는 것에 대해서도 논의했습니다.
저작권 문제에도 불구하고 Meta CEO인 Mark Zuckerberg는 Meta가 계속해서 Llama 모델의 발전을 촉진하고 OpenAI, Google 등 다른 폐쇄형 모델과의 격차를 좁힐 것이라고 강조했습니다.
Meta의 향후 전망과 Llama3의 시장 지위
2024년 7월 주커버그는 Llama3가 성능 면에서 가장 진보된 AI 모델과 비슷하며 일부 영역에서 선두를 달리고 있다고 말했습니다. 그는 2025년부터 메타의 라마 시리즈가 업계에서 가장 발전된 AI 모델이 될 것이라고 예측했다. 그러나 Llama3의 출시는 여전히 증가하는 저작권 소송, 특히 훈련 데이터에 대한 법적 조사와 싸워야 합니다.
전체적으로 메타는 라마3 개발 과정에서 AI 분야에서 야망과 경쟁력을 보여줬지만, 데이터 획득과 저작권 준수 문제도 드러냈다. Llama3와 Meta의 AI 전략의 미래 시장 위치는 이러한 법적 문제를 효과적으로 해결하는 능력에 크게 좌우될 것입니다.