AI の 6,000 億ドルの難題に対する解決策は何でしょうか?スタートアップ幹部が大型モデルのコストと商業化について語る

著者：Eve Cole 更新時間：2024-11-16 11:42:01

北京ニュース Shell Finance News (Bai Jinlei 記者、Chen Weicheng 記者) 10 月 25 日から 26 日にかけて、RTE 開発者コミュニティと Shengwang が共催する RTE2024 第 10 回リアルタイムインターネットカンファレンスが北京で開催されました。会議では、Lepton AIの創設者兼CEOのJia Yangqing氏、MiniMaxのパートナーのWei Wei氏、Wall-Facing Intelligenceの共同創設者兼最高技術責任者のGuoyang Zeng氏、Hugging FaceのエンジニアのWang Tiezhen氏が「AIの600ドルについて」について議論した。基礎から始める10億問題』座談会フォーラム「設備から事業化まで」が業界の注目を集めた。「AI の 6,000 億ドル問題」は、セコイアキャピタルのパートナーであるデイビッドカーン氏の記事に端を発しています。彼は、AI (人工知能) インフラへの巨額の投資と実際の収入とのギャップが大きすぎると考えていました。 AI はバブルの頂点であり、次の革新的なテクノロジーの波である可能性があり、GPU (グラフィックスプロセッシングユニット) のコンピューティング価格の下落は、実際には長期的なイノベーションや新興企業にとっては良いことになるが、投資家は苦しむことになる。

RTE2024 第10回リアルタイムインターネットカンファレンス。写真 | 写真提供: インタビュー対象者AI インフラストラクチャの構築に関して、Jia Yangqing 氏は 2 つの核となる見解を共有しました。特に蒸留や圧縮などのテクノロジーを通じて、同じサイズのモデルはますます高性能になるでしょう。現在の LLama 3.2 3B モデルでも可能です。以前の LLama 70B モデルと同様の機能を備えている; 少数の大手企業を除いて、ますます多くの企業が「オープンソース + ファインチューニング」を採用して次世代モデルを作成するため、オープンソースアーキテクチャの適用はますます一般的になるでしょう。。「オープンソースモデルの利点は、エコロジーとコミュニティです。実用化の観点から見ると、多くの人がオープンソースモデルを見つけて微調整することができますが、オープンソースモデルのすべての問題を解決するには十分ではありません。「将来的には、インフラストラクチャとリアルタイム処理の作業がますます増え、誰もがオープンソースモデル自体に注意を払うだけでなく、オープンソースモデルのインフラストラクチャとデータの閉ループ。そのため、オープンソースモデルをより適切に、より高速に実行するには、TTS (Text to Speech) と大規模なモデルを何らかの方法でまとめてエッジの近くに配置する必要があります。非常に良い結果が得られる可能性があります。「大規模なモデルのトレーニングと推論のコストをどのように見るべきですか?」 Zeng Guoyang 氏は次のように述べています。「テクノロジーの進歩により、コンピューティング能力は確実にますます安くなり、同じ機能を持つモデルの規模はますます小さくなります。しかし、コンピューティング能力コストの最適化は、最終的にはより強力なモデルのトレーニングにつながるでしょう」 AGI（汎用人工知能）レベルを真に達成するには、モデルがますます強力になっているとしか感じられず、壁に面した知能は終わりであるため、コストの変化を感じるのは難しいとも述べました。彼は、エンドツーエンドのモデルをどのように実行するかについて非常に懸念しており、実際のデプロイメントプロセス中に、エンドでモデルをより高速に実行するために、さまざまな量子化圧縮やスパース化手法を使用して、実際のデプロイメントのオーバーヘッドを最適化します。 Jia Yangqing 氏は、コストは考慮すべき事項ではないとも指摘しました。同氏は、アプリケーションを構築する際、推論コストが現在の10分の1に下がると判断し、現在の10分の1のアプリケーション作成コストに基づいて原価計算を行うことができる。モデル、ハードウェアを含めて実行できるかどうかを確認し、大量に適用した後はコストも削減できます。最近の報道によると、OpenAI は AI セキュリティ研究に重点を置いた「AGI Readiness」チームを解散する予定です。現在の AI 企業の創設者たちは、AI の安全性と倫理の問題をどのように見ていますか?たとえば、Jia Yangqing 氏は、現在の航空機には多くの安全要件があるが、ロケット製造にはより柔軟性が与えられていると述べました。したがって、OpenAI はより良い初期開発に適しているのではないか、あるいは AI セキュリティが従来のセキュリティカテゴリから飛び出ていないのではないか、と同氏は推測しています。王鉄鎮氏は、AIが人間に取って代わることを心配するのは比較的早い段階であるが、AIはすでに一部の業界にマイナスの影響を与えている、例えば、偽と本物のビデオの影響や、十代の若者の心理への影響などを述べた。ここには起業家精神を発揮するチャンスがたくさんあります。 Shengwangはイベントで、MiniMaxと中国初のRealtime API（リアルタイム処理アプリケーションプログラミングインターフェース）を磨き上げていると発表した。では、オーディオとビデオのマルチモーダルモデルの実用化の可能性をどのように見るべきでしょうか?ウェイウェイ氏は、マルチモダリティの出現により、生成人工知能の境界は拡大し続け、この業界の変革を加速すると述べた。 Wei Wei 氏は、製品とユーザーサービスのプロセスから、テキスト、音声、音楽、ビデオなどのモデルが、アート、映画、テレビ、音楽、その他の分野のクリエイターの効率を大幅に向上させ、新しいアイデアや手法を提供するのに役立つことを発見しました。。また、Wang Tiezhen 氏は、ビデオ生成の効果が映画レベルの効果を超え、複数回生成する必要がなければ、たとえ価格が高くても試してみる人々もいるだろうと考えています。