Les grands modèles de cette année ont été extrêmement vivants au premier semestre, mais un peu cool au second semestre.
Faire de la recherche et du développement de modèles de bas niveau à grande échelle est comme un marathon de longue durée, avec des coûts de recherche et développement élevés, des seuils techniques élevés et une concurrence itérative féroce. Prenez OpenAI, par exemple, ses pertes annuelles en recherche et développement s'élèvent à 5 milliards de dollars. Une telle pression financière n’est évidemment pas quelque chose que les entreprises d’IA ordinaires peuvent supporter. Les startups d’IA ont également tendance à être très pragmatiques, considérant toujours la commercialisation et la réalisation de bénéfices comme des considérations essentielles.
L’IA est en passe de trouver ses propres utilisations, et la génération vidéo peut être considérée comme l’une des pistes les plus proches de l’application. Cependant, aujourd’hui, le PDG de Runway, la société « de premier plan » qui génère des vidéos d’IA, a « condamné à mort » la société d’IA. Dans sa lettre ouverte, le premier paragraphe dit : « Je pense que l’ère des entreprises d’IA est révolue ».
Cristóbal Valenzuela Barrera, co-fondateur et PDG de Runway
Le texte intégral de la lettre est le suivant :
Runway n'est pas une société d'IA. Runway est une société de médias et de divertissement. En fait, je pense que l’ère des entreprises d’IA est révolue.
Ce n’est pas parce que l’IA a échoué, bien au contraire, mais parce que l’IA est en train de devenir une infrastructure comme l’électricité ou Internet. Se qualifier d’entreprise d’IA aujourd’hui, c’est comme se qualifier d’entreprise Internet en 2024. Cela n’a aucun sens parce que tout le monde l’utilise : chaque entreprise utilise Internet ; chaque entreprise utilisera l’intelligence artificielle.
Pour Runway, nous nous concentrons sur les secteurs des arts, des médias et du divertissement au sens large. La vision que nous avons lancée sur Runway il y a sept ans reste inchangée : l'intelligence artificielle est un outil essentiel pour la narration. Pour réaliser cette vision, nous avons dû faire le contraire et constituer la meilleure équipe de recherche pour fournir les meilleurs modèles pour prendre en charge les meilleurs produits.
Je compare souvent notre travail à un nouveau type de « caméra ». La « caméra » ici ne capture pas littéralement des images, mais fait plutôt référence à une échelle historique à plus long terme. L’appareil photo n’a pas seulement créé la photographie : il a donné naissance à des industries, des économies et des formes d’art entières. Films, télévision, TikTok : tout a commencé avec cet outil révolutionnaire qui capturait la lumière et le temps.
Je pense que le travail de Runway consiste à jeter les bases d'un tout nouveau paysage médiatique. Tout comme les caméras ont changé la façon dont nous capturons la réalité, l’intelligence artificielle change la façon dont nous créons la réalité. Les modèles et les technologies construits par Runway ne sont qu'un début : ils sont l'équivalent de ces daguerréotypes originaux, bruts mais pleins de possibilités.
Le daguerréotype est une des premières techniques photographiques inventées en 1839 par le Français Louis Daguerre.
Beaucoup de gens considèrent à tort l’intelligence artificielle comme l’objectif ultime. Ils ont tort. L’IA n’est qu’un outil et un moyen de soutenir de plus grandes réalisations. La véritable révolution ne réside pas dans la technologie elle-même, mais dans ce qu’elle peut permettre : créer de nouvelles formes d’expression, ouvrir de nouvelles façons de raconter des histoires et trouver de nouvelles façons de se connecter à l’expérience humaine.
Les médias traditionnels sont comme une rue à sens unique. Les créations parviennent aux consommateurs via des canaux établis. Même si la distribution est perturbée d’abord par les réseaux sociaux puis par le streaming, le modèle de base existe toujours : certains créent, d’autres consomment. Les rôles sont clairs et les limites sont claires. Cependant, nous assistons désormais à une situation complètement nouvelle.
Imaginez que l'émission que vous regardez est générée automatiquement au fur et à mesure que vous la regardez : un contenu véritablement dynamique qui vous répond, vous comprend et est entièrement adapté à vous. Les mondes analogiques qui permettent au contenu de se façonner en temps réel peuvent faire disparaître les frontières entre création et distribution. Ce n’est pas seulement la base de la construction d’un nouveau paysage médiatique, mais cela redéfinira également fondamentalement les médias : ils sont interactifs, génératifs et personnalisés, mais aussi partagés et universels.
C’est pourquoi les entreprises purement IA deviennent obsolètes. La question fondamentale à laquelle il faut répondre aujourd’hui n’est plus simplement la technologie : mais que pouvons-nous créer avec la technologie ? La prochaine vague d’innovation ne viendra pas d’entreprises axées sur les modèles de recherche. Les modèles sont devenus une marchandise. Les bases techniques sont désormais solides et il n’y a plus de secret dans l’industrie. Le véritable changement viendra de ceux qui savent utiliser ces outils pour créer de nouvelles formes médiatiques, de nouvelles expériences et de nouveaux récits. L’infrastructure a été mise en place et la prochaine étape consiste à utiliser l’IA pour créer des choses significatives.
La fin des entreprises d’IA marque un nouveau départ : la naissance d’un nouveau média. Il ne s’agit pas seulement d’une nouvelle plateforme ou d’un nouveau format, c’est une toute nouvelle façon de créer et d’expérimenter du contenu. Nous ne nous engageons plus à créer une entreprise d’IA. Il s’agit d’une mission plus passionnante, à l’image de ce que Runway a toujours poursuivi : revenir à notre intention initiale.
Piste "Attrape-chevaux"
Runway a été fondée en 2018. Le fondateur et PDG Cristóbal Valenzuela Barrera estime que l'intelligence artificielle a un grand potentiel dans le domaine de la création artistique. Par conséquent, Runway s'est engagé à fournir des outils et des plateformes aux designers, artistes et développeurs depuis sa création.
Équipe fondatrice de Runway : de gauche à droite : Alejandro Matamala, Cristóbal Valenzuela Barrera, AnastASIs Germanidis
En revenant sur l'histoire du développement de Runway, nous constaterons quelques incidents de « capture de chevaux » : les équipes derrière Stable Diffusion étaient en désaccord les unes avec les autres, et la bibliothèque HuggingFace a été soudainement supprimée...
Lorsqu'on évoque aujourd'hui Stable Diffusion, on peut penser qu'il s'agit du travail de recherche de Stability AI, mais en fait, la source technique de ce modèle est un article "High-Resolution Image Synthesis with Latent Diffusion Models" publié dans CVPR 2022, signé Il y a cinq auteurs au total, issus de l'Université de Munich, de l'Université de Heidelberg et de Runway. En 2022, Runway a officiellement annoncé la sortie de Stable Diffusion v1.5 et a eu des conflits avec Stability AI concernant des problèmes de droits d'auteur de Stable Diffusion.
Fin août de cette année, Runway a soudainement supprimé et effacé tout son contenu sur HuggingFace, y compris Stable Diffusion v1.5. Sur la page d'accueil de Hugging Face, Runway déclare ne plus gérer HuggingFace.
Bien que ces incidents prêtent quelque peu à confusion, Runway a continué à faire des efforts dans le domaine de la génération visuelle. Par exemple, Gen-3 Alpha, un modèle de base de génération vidéo récemment lancé par Runway, peut créer des vidéos haute définition avec des changements de scène complexes, plusieurs styles de films et des conseils artistiques détaillés.
Récemment, Gen-3 Alpha a également publié une nouvelle fonctionnalité - Act-One, qui permet aux utilisateurs de télécharger une vidéo pour conduire le personnage vidéo à faire les mêmes expressions et actions, ce qui peut être considéré comme ayant bouleversé l'industrie de la capture de mouvement.
Si « l’ère des entreprises d’IA est révolue », alors Runway semble avoir créé des outils et de la valeur dans les domaines des arts, des médias et du divertissement au sens large. Peut-être, comme l'a dit le PDG, l'IA sera-t-elle une infrastructure à l'avenir, et ce qui mérite davantage d'être réfléchi et exploré, c'est l'orientation de l'application de l'IA.
Êtes-vous d’accord avec le point de vue du PDG de Runway ?