Os grandes modelos deste ano estiveram extremamente animados no primeiro semestre, mas um pouco descolados no segundo semestre.
Fazer pesquisa e desenvolvimento de modelos de baixo nível e grande escala é como uma maratona de longa duração, com altos custos de pesquisa e desenvolvimento, altos limites técnicos e competição acirrada de iteração. Tomemos como exemplo a OpenAI, as suas perdas anuais com investigação e desenvolvimento chegam aos 5 mil milhões de dólares. Obviamente, essa pressão financeira não é algo que as empresas comuns de IA possam suportar. As startups de IA também tendem a ser muito pragmáticas, sempre considerando a comercialização e a realização de lucros como considerações centrais.
A IA está no caminho de encontrar seus próprios usos, e a geração de vídeo pode ser considerada um dos caminhos mais próximos da aplicação. No entanto, hoje, o CEO da Runway, a empresa “de primeira linha” que gera vídeos de IA, “sentenciou a morte” à empresa de IA. Na sua carta aberta, o primeiro parágrafo diz: “Acho que a era das empresas de IA acabou”.
Cofundador e CEO da Runway, Cristóbal Valenzuela Barrera
O texto completo da carta é o seguinte:
Runway não é uma empresa de IA. Runway é uma empresa de mídia e entretenimento. Na verdade, acho que a era das empresas de IA acabou.
Isto não acontece porque a IA falhou – muito pelo contrário – mas porque a IA está a tornar-se uma infra-estrutura como a electricidade ou a Internet. Considerar-se uma empresa de IA hoje é como se autodenominar uma empresa de Internet em 2024. Não faz sentido porque todos a utilizam: todas as empresas utilizam a Internet;
Para a Runway, nosso foco está nos setores de artes, mídia e entretenimento em geral. A visão que iniciamos na Runway há sete anos permanece inalterada: a inteligência artificial é uma ferramenta essencial para contar histórias. Para concretizar esta visão, tivemos que fazer o oposto e construir a melhor equipa de investigação para fornecer os melhores modelos para apoiar os melhores produtos.
Costumo comparar nosso trabalho a um novo tipo de “câmera”. A “câmera” aqui não captura imagens literalmente, mas refere-se a uma escala histórica de longo prazo. A câmera não criou apenas a fotografia – ela deu origem a indústrias, economias e formas de arte inteiras. Filmes, TV, TikTok – tudo começou com aquela ferramenta revolucionária que capturava luz e tempo.
Acho que o trabalho da Runway é lançar as bases para um cenário de mídia totalmente novo. Assim como as câmeras mudaram a forma como capturamos a realidade, a inteligência artificial está mudando a forma como criamos a realidade. Os modelos e tecnologias que a Runway construiu são apenas o começo - são equivalentes aos daguerreótipos originais, brutos, mas cheios de possibilidades.
O daguerreótipo é uma técnica fotográfica inventada em 1839 pelo francês Louis Daguerre.
Muitas pessoas veem erroneamente a inteligência artificial como o objetivo final. Eles estão errados. A verdadeira revolução não reside na tecnologia em si, mas naquilo que ela pode permitir: ser pioneira em novas formas de expressão, desbloquear novas formas de contar histórias e encontrar novas formas de ligação à experiência humana.
A mídia tradicional é como uma rua de mão única. As criações fluem para os consumidores através de canais estabelecidos. Mesmo que a distribuição seja perturbada primeiro pelas redes sociais e depois pela streaming media, o modelo básico ainda existe: algumas pessoas criam, outras consomem. As funções são claras e os limites são claros. No entanto, agora assistimos a uma situação completamente nova.
Imagine que o programa que você está assistindo é gerado automaticamente conforme você o assiste - um conteúdo verdadeiramente dinâmico que responde a você, entende você e é totalmente personalizado para você. Mundos analógicos que permitem que o conteúdo se molde em tempo real podem dissolver as fronteiras entre criação e distribuição. Esta não é apenas a base para a construção de um novo panorama mediático, mas também redefinirá fundamentalmente os meios de comunicação: são interativos, generativos e personalizados, mas também partilhados e universais.
É por isso que as empresas de IA pura estão se tornando obsoletas. A questão fundamental que precisa de ser respondida agora já não é simplesmente a tecnologia – mas o que podemos criar com a tecnologia? A próxima onda de inovação não virá de empresas que se concentrem em modelos de investigação. Os modelos se tornaram uma mercadoria. A base técnica agora é sólida e não há segredos na indústria. A verdadeira mudança virá daqueles que souberem usar estas ferramentas para criar novas formas de mídia, novas experiências e novas narrativas. A infraestrutura foi estabelecida e o próximo passo é usar a IA para criar coisas significativas.
O fim das empresas de IA marca um novo começo: o nascimento de uma nova mídia. Esta não é apenas uma nova plataforma ou formato, é uma forma totalmente nova de criar e experimentar conteúdo. Não estamos mais comprometidos em construir uma empresa de IA. Esta é uma missão mais emocionante, tal como a que a Runway sempre perseguiu: regressar à nossa intenção original.
Pista "Captura de Cavalos"
A Runway foi fundada em 2018. O fundador e CEO Cristóbal Valenzuela Barrera acredita que a inteligência artificial tem um grande potencial no campo da criação artística. Portanto, a Runway está comprometida em fornecer ferramentas e plataformas para designers, artistas e desenvolvedores desde o seu início.
Equipe fundadora da Runway: da esquerda para a direita: Alejandro Matamala, Cristóbal Valenzuela Barrera, AnastASIs Germanidis
Olhando para trás, para a história de desenvolvimento da Runway, encontraremos alguns incidentes de "agarramento de cavalos": as equipes por trás do Stable Diffusion estavam em desacordo, e a biblioteca HuggingFace foi repentinamente excluída...
Quando a Difusão Estável é mencionada hoje, podemos pensar que é o trabalho de pesquisa da Stability AI, mas na verdade, a fonte técnica deste modelo é um artigo "Síntese de imagens de alta resolução com modelos de difusão latente" publicado no CVPR 2022, assinado São cinco autores no total, da Universidade de Munique, da Universidade de Heidelberg e da Runway. Em 2022, a Runway anunciou oficialmente o lançamento do Stable Diffusion v1.5 e teve conflitos com o Stability AI por questões de direitos autorais do Stable Diffusion.
No final de agosto deste ano, a Runway excluiu e limpou repentinamente todo o seu conteúdo no HuggingFace, incluindo Stable Diffusion v1.5. Na página inicial do Hugging Face, a Runway afirma que não mantém mais o HuggingFace.
Embora esses incidentes sejam um tanto confusos, a Runway continuou a fazer esforços na área de geração visual. Por exemplo, Gen-3 Alpha, um modelo básico de geração de vídeo lançado recentemente pela Runway, pode criar vídeos de alta definição com mudanças complexas de cena, vários estilos de filme e orientação artística detalhada.
Recentemente, Gen-3 Alpha também lançou um novo recurso - Act-One, que permite aos usuários enviar um vídeo para levar o personagem do vídeo a fazer as mesmas expressões e ações, o que pode ser considerado uma subversão da indústria de captura de movimento.
Se “a era das empresas de IA acabou”, então a Runway parece ter criado ferramentas e valor nas artes, na mídia e nos campos mais amplos do entretenimento. Talvez, como disse o CEO, a IA seja uma infraestrutura no futuro, e o que vale mais a pena pensar e explorar é a direção de aplicação da IA.
Você concorda com as opiniões do CEO da Runway?