今年のビッグモデルは、前半は非常に活気がありましたが、後半は少しクールでした。
低レベルの大規模モデルの研究開発を行うことは、高額な研究開発コスト、高い技術的閾値、そして熾烈な反復競争を伴う、長時間続くマラソンのようなものです。たとえば、OpenAI の場合、研究開発による年間損失は 50 億ドルにも上ります。このような財務的プレッシャーは、明らかに通常の AI 企業が耐えられるものではありません。 AI スタートアップ企業は非常に現実的である傾向があり、常に商業化と利益の実現を中心的な考慮事項として考慮しています。
AI は独自の用途を見つける途上にあり、ビデオ生成は応用に最も近い道の 1 つと見なすことができます。しかし今日、AIビデオを生成する「一流」企業であるRunwayのCEOがAI企業に「死刑を宣告」された。同氏の公開書簡の最初の段落には「AI企業の時代は終わったと思う」と書かれている。
ランウェイの共同創設者兼 CEO クリストバル・バレンズエラ・バレラ氏
手紙の全文は以下の通り。
ランウェイはAI企業ではありません。ランウェイはメディアおよびエンターテイメント会社です。実際、AI企業の時代は終わったと思います。
これはAIが失敗したからではなく、むしろその逆であり、AIが電気やインターネットのようなインフラになりつつあるからだ。現在、AI 企業を名乗ることは、2024 年にインターネット企業を名乗るようなものです。誰もがインターネットを使用しているため、これは意味がありません。すべての企業がインターネットを使用し、すべての企業が人工知能を使用することになります。
Runway では、芸術、メディア、そしてより幅広いエンターテイメント分野に焦点を当てています。 7 年前に Runway を始めた私たちのビジョンは変わっていません。それは、人工知能がストーリーテリングに不可欠なツールであるということです。このビジョンを実現するには、その逆を行い、最高の製品をサポートする最高のモデルを提供する最高の研究チームを構築する必要がありました。
私はよく私たちの仕事を新しい種類の「カメラ」に例えます。ここでの「カメラ」は文字通り画像をキャプチャするものではなく、より長期的な歴史的スケールを指します。カメラは写真を生み出すだけではなく、産業、経済、芸術形式全体を生み出しました。映画、テレビ、TikTok — すべては、光と時間を捉えた革新的なツールから始まりました。
ランウェイの仕事は、まったく新しいメディア環境の基礎を築くことだと思います。カメラが現実を捉える方法を変えたのと同じように、人工知能は私たちが現実を作り出す方法を変えています。 Runway が構築したモデルとテクノロジーはほんの始まりにすぎません。それらはオリジナルのダゲレオタイプと同等であり、未加工ですが可能性に満ちています。
ダゲレオタイプは、1839 年にフランス人のルイ・ダゲールによって発明された初期の写真技法です。
多くの人が人工知能を究極の目標だと誤解しています。彼らは間違っています。AI は単なるツールであり、より大きな成果をサポートするための手段です。本当の革命はテクノロジー自体にあるのではなく、それが可能にするものにあります。つまり、新しい表現形式を開拓し、ストーリーを伝える新しい方法を解き放ち、人間の経験とつながる新しい方法を見つけることです。
従来のメディアは一方通行のようなものです。作品は確立されたチャネルを通じて消費者に届けられます。たとえ最初にソーシャル メディアによって、次にストリーミング メディアによって流通が混乱したとしても、基本的なモデルは依然として存在します。つまり、作成する人もいれば、消費する人もいます。役割は明確であり、境界も明確です。しかし今、私たちは全く新しい状況を目の当たりにしています。
あなたが見ている番組が、視聴中に自動的に生成されることを想像してください。それは、あなたに応答し、あなたを理解し、あなたに完全に合わせた真に動的なコンテンツです。コンテンツをリアルタイムで形づくることができるアナログの世界では、作成と配布の間の境界がなくなります。これは、新しいメディア環境を構築するための基礎であるだけでなく、メディアを根本的に再定義することになります。メディアは、インタラクティブで、生成的で、パーソナライズされたものであるだけでなく、共有され、普遍的なものでもあります。
純粋なAI企業が時代遅れになりつつあるのはこのためです。今答えるべき根本的な問いは、もはや単なるテクノロジーではなく、テクノロジーを使って何を生み出すことができるのかということです。次のイノベーションの波は、研究モデルに重点を置いている企業からは生まれません。模型は商品になってしまった。現在、技術的基盤は強固であり、業界に秘密はありません。本当の変化は、これらのツールを使用して新しいメディア形式、新しい体験、新しい物語を生み出す方法を知っている人々によってもたらされます。インフラは整いました。次のステップは、AI を使って意味のあるものを生み出すことです。
AI企業の終焉は、新たなメディアの誕生という新たな始まりを意味する。これは単なる新しいプラットフォームやフォーマットではなく、コンテンツを作成して体験するまったく新しい方法です。私たちはもはや AI 企業の構築には取り組んでいません。これは、ランウェイが常に追求してきた「初心に立ち返ること」と同様、よりエキサイティングなミッションです。
「馬を捕まえる」滑走路
ランウェイは 2018 年に設立されました。創設者兼 CEO のクリストバル・バレンズエラ・バレラ氏は、人工知能が芸術創作の分野で大きな可能性を秘めていると信じています。したがって、Runway は創業以来、デザイナー、アーティスト、開発者にツールとプラットフォームを提供することに注力してきました。
ランウェイ創設チーム: 左から右へ: アレハンドロ マタマラ、クリストバル バレンズエラ バレラ、アナスタシス ゲルマニディス
Runway の開発の歴史を振り返ると、Stable Diffusion の開発チームが互いに対立したり、HuggingFace ライブラリが突然削除されたりするなど、いくつかの「馬の奪い合い」事件が見つかります。
今日安定拡散というと、安定性 AI の研究成果と思われるかもしれませんが、実際、このモデルの技術的ソースは、CVPR 2022 で発表された論文「潜在拡散モデルによる高解像度画像合成」です。著者はミュンヘン大学、ハイデルベルク大学、ランウェイの計5名。 2022 年、Runway は Stable Diffusion v1.5 のリリースを正式に発表しましたが、Stable Diffusion の著作権問題をめぐって Stability AI と対立しました。
今年 8 月末、Runway は突然、Stable Diffusion v1.5 を含む HuggingFace 上のすべてのコンテンツを削除し、消去しました。 Hugging Face のホームページで、Runway は HuggingFace を今後維持しないと述べています。
これらの事件はやや混乱を招きますが、ランウェイはビジュアル生成の分野で努力を続けています。たとえば、Runway が最近発表したビデオ生成基本モデルである Gen-3 Alpha は、複雑なシーン変更、複数のムービー スタイル、および詳細なアート ガイダンスを備えた高解像度ビデオを作成できます。
最近、Gen-3 Alpha は新機能 Act-One もリリースしました。これにより、ユーザーがビデオをアップロードして、ビデオ キャラクターに同じ表情や動作をさせることができます。これはモーション キャプチャ業界を転覆させたと言えます。
「AI企業の時代は終わった」とするなら、ランウェイは芸術、メディア、そしてより広範なエンターテイメント分野でツールと価値を生み出しているようだ。おそらく、CEO が言ったように、AI は将来インフラとなるでしょう。それよりも考え、模索する価値があるのは、AI の応用方向です。
Runway CEO の意見に同意しますか?