올해 빅모델들은 상반기에는 굉장히 활기가 넘쳤지만, 하반기에는 좀 시원했다.
낮은 수준의 대규모 모델 연구 및 개발을 수행하는 것은 연구 개발 비용이 높고 기술적 한계가 높으며 반복 경쟁이 치열한 장기간의 마라톤과 같습니다. 예를 들어 OpenAI의 연구 개발로 인한 연간 손실은 최대 50억 달러에 이릅니다. 이러한 재정적 압박은 분명 일반 AI 기업이 감당할 수 있는 것이 아니다. AI 스타트업 역시 매우 실용적인 경향이 있어 항상 상용화와 수익 실현을 핵심 고려사항으로 고려합니다.
AI는 그 자체의 용도를 찾는 과정에 있으며, 비디오 생성은 응용에 가장 가까운 트랙 중 하나로 간주될 수 있습니다. 그런데 오늘 AI 영상을 제작하는 '일류' 기업 런웨이의 CEO가 AI 기업에 '사형을 선고'했다. 그의 공개서한 첫 문단에는 “AI 기업의 시대는 끝났다고 생각한다”고 적혀 있다.
런웨이 공동 창립자 겸 CEO Cristóbal Valenzuela Barrera
편지의 전문은 다음과 같습니다.
런웨이는 인공지능 회사가 아닙니다. Runway는 미디어 및 엔터테인먼트 회사입니다. 사실 AI 기업의 시대는 끝났다고 생각한다.
이는 AI가 실패했기 때문이 아니라(정반대로) AI가 전기나 인터넷과 같은 인프라가 되었기 때문입니다. 오늘날 자신을 AI 회사라고 부르는 것은 2024년에 자신을 인터넷 회사라고 부르는 것과 같습니다. 모든 사람이 인터넷을 사용하고 있기 때문에 이는 말이 되지 않습니다. 모든 회사가 인터넷을 사용하기 때문에 모든 회사가 인공 지능을 사용할 것입니다.
Runway의 경우 예술, 미디어 및 더 넓은 엔터테인먼트 분야에 중점을 두고 있습니다. 7년 전 Runway를 시작한 비전은 변함이 없습니다. 인공 지능은 스토리텔링을 위한 필수 도구입니다. 이 비전을 실현하기 위해 우리는 반대로 최고의 제품을 지원하는 최고의 모델을 제공하기 위해 최고의 연구팀을 구성해야 했습니다.
나는 종종 우리의 작업을 새로운 종류의 '카메라'에 비유합니다. 여기서 "카메라"는 말 그대로 이미지를 포착하는 것이 아니라 장기적인 역사적 규모를 의미합니다. 카메라는 단순히 사진을 창조한 것이 아니라 전체 산업, 경제, 예술 형식을 탄생시켰습니다. 영화, TV, TikTok — 모두 빛과 시간을 포착하는 혁신적인 도구로 시작되었습니다.
나는 Runway의 임무가 완전히 새로운 미디어 환경을 위한 토대를 마련하는 것이라고 생각합니다. 카메라가 우리가 현실을 포착하는 방식을 바꾸었듯이, 인공지능도 우리가 현실을 창조하는 방식을 바꾸고 있습니다. Runway가 구축한 모델과 기술은 시작에 불과합니다. 원본 은판사진과 동일하지만 가능성이 가득합니다.
다게레오타입은 1839년 프랑스인 루이 다게르(Louis Daguerre)가 발명한 초기 사진 기술입니다.
많은 사람들이 인공지능을 궁극적인 목표로 잘못 생각하고 있습니다. AI는 더 큰 성과를 지원하는 도구이자 방법일 뿐입니다. 진정한 혁명은 기술 자체에 있는 것이 아니라 기술이 가능하게 하는 것, 즉 새로운 형태의 표현을 개척하고, 이야기를 전달하는 새로운 방법을 찾고, 인간 경험에 연결하는 새로운 방법을 찾는 데 있습니다.
전통적인 미디어는 일방 통행로와 같습니다. 창작물은 확립된 채널을 통해 소비자에게 전달됩니다. 먼저 소셜 미디어에 의해, 그 다음에는 스트리밍 미디어에 의해 배포가 중단되더라도 기본 모델은 여전히 존재합니다. 어떤 사람은 만들고 다른 사람은 소비합니다. 역할이 명확하고 경계도 명확합니다. 그러나 이제 우리는 완전히 새로운 상황을 목격하고 있습니다.
당신이 보고 있는 쇼가 시청할 때 자동으로 생성된다고 상상해 보십시오. 당신에게 반응하고, 당신을 이해하며, 당신에게 완벽하게 맞춰진 진정으로 역동적인 콘텐츠입니다. 콘텐츠가 실시간으로 형성될 수 있는 아날로그 세계는 제작과 배포 사이의 경계를 허물 수 있습니다. 이는 새로운 미디어 환경을 구축하기 위한 기초일 뿐만 아니라 미디어를 근본적으로 재정의할 것입니다. 즉, 미디어는 상호작용적이고 생성적이며 개인화될 뿐만 아니라 공유되고 보편적입니다.
이것이 순수 AI 기업이 구식이 되어가는 이유이다. 이제 답해야 할 근본적인 질문은 더 이상 단순한 기술이 아니라 기술로 무엇을 만들 수 있는가? 차세대 혁신의 물결은 연구 모델에 중점을 두는 기업에서 나오는 것이 아닙니다. 모델은 상품이 되었습니다. 이제 기술적인 기반이 탄탄하고 업계에 비밀이 없습니다. 진정한 변화는 이러한 도구를 사용하여 새로운 미디어 형식, 새로운 경험, 새로운 내러티브를 만드는 방법을 아는 사람들에게서 나올 것입니다. 인프라는 마련됐고, 다음 단계는 AI를 활용해 의미 있는 것들을 만들어내는 것이다.
AI 기업의 종말은 새로운 시작, 즉 새로운 미디어의 탄생을 의미합니다. 이는 단지 새로운 플랫폼이나 형식이 아니라 콘텐츠를 만들고 경험하는 완전히 새로운 방식입니다. 우리는 더 이상 AI 회사를 만드는 데 전념하지 않습니다. 이것은 런웨이가 늘 추구해왔던 것과 마찬가지로 더욱 흥미진진한 사명입니다. 바로 원래의 의도로 돌아가는 것입니다.
"말 잡기" 런웨이
Runway는 2018년에 설립되었습니다. 창립자이자 CEO인 Cristóbal Valenzuela Barrera는 인공 지능이 예술 창작 분야에서 큰 잠재력을 가지고 있다고 믿습니다. 따라서 Runway는 창립 이래 디자이너, 아티스트 및 개발자를 위한 도구와 플랫폼을 제공하기 위해 최선을 다해 왔습니다.
Runway 창립 팀: 왼쪽에서 오른쪽으로: Alejandro Matamala, Cristóbal Valenzuela Barrera, AnastASIs Germanidis
Runway의 개발 역사를 되돌아보면 "말을 잡는" 사건이 몇 가지 발견됩니다. Stable Diffusion 팀이 서로 충돌했고 HuggingFace 라이브러리가 갑자기 삭제되었습니다...
오늘 Stable Diffusion을 언급하면 Stability AI의 연구 성과라고 생각할 수도 있지만, 실제로 이 모델의 기술 소스는 CVPR 2022에 게재된 "High-Resolution Image Synesis with Latent Diffusion Models"라는 논문입니다. 저자는 뮌헨대학교, 하이델베르그대학교, Runway 출신 총 5명입니다. 2022년 Runway는 Stable Diffusion v1.5의 출시를 공식적으로 발표했으며 Stable Diffusion 저작권 문제를 놓고 Stability AI와 충돌을 겪었습니다.
올해 8월 말, Runway는 갑자기 Stable Diffusion v1.5를 포함하여 HuggingFace의 모든 콘텐츠를 삭제하고 정리했습니다. Hugging Face 홈페이지에서 Runway는 더 이상 HuggingFace를 유지하지 않는다고 명시합니다.
이번 사건은 다소 혼란스럽기도 하지만, 런웨이는 비주얼 제너레이션 분야에서 꾸준히 노력해왔습니다. 예를 들어, 최근 런웨이가 출시한 비디오 세대 기본 모델인 Gen-3 Alpha는 복잡한 장면 전환, 다양한 영화 스타일, 상세한 아트 가이드를 통해 고화질 비디오를 제작할 수 있습니다.
최근 3세대 알파는 사용자가 영상을 업로드해 영상 캐릭터가 동일한 표정과 행동을 하도록 유도하는 액트원(Act-One)이라는 새로운 기능도 공개했는데, 이는 모션 캡쳐 업계를 전복시켰다고 할 수 있다.
'AI 기업의 시대가 끝났다'면 런웨이는 예술, 미디어, 더 넓은 엔터테인먼트 분야에서 도구와 가치를 만들어 온 것 같다. 아마도 CEO의 말처럼 AI는 미래의 인프라가 될 것이고, 더 고민하고 탐구해볼 가치가 있는 것은 AI의 적용 방향일 것이다.
Runway CEO의 견해에 동의하시나요?