9月5日、香港科技大学理事長であり国家工程院の外国人学者でもある舜向陽氏は、2024年国際包摂における大規模モデル産業の実施に関する8つの考えを共有した。・外灘会議。 AI エージェント時代の到来は、突然すべてのワークフローを置き換える魔法のような強力なモデルではないと彼は信じています。これには、テクノロジー、エンジニアリング、市場の継続的な統合が含まれ、最終的には期待を超えるサービスが人間に提供されます。
「今日、大規模なモデルやディープラーニングを行う場合、まず最も重要なことはコンピューティング能力を備えていることです。」と Shen Xiangyang 氏は述べています。同氏は、2010年以降、大規模モデルに必要な計算能力が6~7倍に増加していると指摘した。ここ数年は安定しており、毎年約4倍に成長しています。モデルはますます大きくなり、パラメータの数はますます増加しており、パラメータの増加に伴ってコンピューティング能力の需要も横ばいの方向に増加しています。同氏の見解では、コンピューターチップ産業全体の発展は、当初の「ムーアの法則」から「ファンの法則」に変化したという。ムーアの法則では、コンピューティング能力は 18 か月ごとに 2 倍になると考えられていました。現在、GPU により AI のコンピューティング能力は年々 2 倍になると予測されています。 「カードについて話すのは気分が悪くなりますが、カードがなければ感情は生まれません。かつては貧困が想像力を制限するという言葉がありましたが、今では貧困が想像力を歪める可能性があります。カードがなければ、違うかもしれないと想像することもできます」と沈祥陽は感情を込めてため息をつきました。公開情報によれば、GPT3の学習データはトークン(スループット)2T、GPT4の学習データは約12Tに達している。シュン・シャンヤンの予測によると、GPT5のトレーニングデータは200Tに達する可能性があります。インターネット上の現在のデータは、将来のモデルトレーニングのニーズを満たすには程遠いため、より多くのデータをマイニングする方法を考える必要があります。人工知能の分野では、データはモデルの「燃料」とみなされ、モデルはこのデータから有用な情報を学習して抽出する必要があります。したがって、データの量、質、多様性はモデルの精度とパフォーマンスに直接影響します。 Shen Xiangyang 氏は、これまでインターネットの中核的な蓄積として、ほとんどのデータは Google によって検索エンジンを作成するために使用されていましたが、将来的にはこれらのデータが大規模なモデルのトレーニングに使用されるようになるだろうと述べました。 「過去 40 年にわたってインターネットに蓄積されたデータは、まさにこのような AI の瞬間のためのもののようです。」次は何でしょうか? Shen Xiangyang 氏は、大規模モデル業界の将来の発展の道筋は非常に明確であり、以前の大規模言語モデルからマルチモーダル モデル、そして将来的にはワールド モデルに移行すると信じています。技術的に言えば、理解と生成を統一する道を歩まなければなりません。 「未来は間違いなく、身体化された知能とロボットの方向に進むでしょう。その特殊な形態の一つが自動運転です。」とシェン・シャンヤン氏は語った。実際、業界には世界モデルの標準定義がありません。 OpenAIが打ち出したsoraモデルは、業界内で「ワールドモデル」に関する議論を引き起こすきっかけとなった。 OpenAI は、これを現実世界を理解し、シミュレートできるモデルの基礎と考えており、その機能が AGI (汎用人工知能) を達成するための重要なマイルストーンであると考えています。しかし、Shun Xiangyang 氏は、「Sora モデルは非常に優れていますが、それほど強力ではありません。その物理的特性は保証できず、世界モデルにはなり得ません。」と考えています。大規模モデルは、一般大規模モデル、業界大規模モデル、エンタープライズ大規模モデル、個人大規模モデルに分類できます。 Shen Xiangyang 氏は、汎用大規模モデルは AI の基礎であり、汎用大規模モデルのトレーニングには少なくとも 10,000 カロリーが必要であり、業界の大規模モデルはドメイン アプリケーションのベースであり、キロカロリー レベルのトレーニングが必要であると指摘しました。企業データの価値を再発見するには、何百カロリーものトレーニングが必要です。これらの大規模モデルでは、コンピューティング能力に対する要件が非常に高くなります。 「最もエキサイティングなことは、大規模なパーソナルモデルです。たとえば、レノボとマイクロソフトはAIPCを推進しており、アップルのアップルインテリジェンスはすべてパーソナルインテリジェンスの方向に開発を進めています。」とシェン・シャンヤン氏は語った。今年7月末現在、中国では197の大型モデルが登録されており、そのうち30%が一般大型モデル、70%が業界大型モデルである。 「業界では大型モデルが大半を占めており、将来的には間違いなくその数は増えるだろう。」とShen Xiangyang氏は述べた。思考5: AIエージェント〜ビジョンから実装まで〜 2024 年 5 月、マイクロソフトの創設者ビル ゲイツは、AI エージェントは誰もがコンピューターと対話する方法を変えるだけでなく、ソフトウェア業界を破壊し、コマンドの入力からアイコンのクリックまで以来最大のコンピューティング革命をもたらすだろうと公に述べました。舜祥陽もこの意見に同意した。彼は、人工知能の時代における本当に素晴らしいスーパー アプリケーションは AI エージェントであると信じています。 AI エージェントのビジョンから実装までのプロセスでは、常にニーズに焦点を当て、モデルの機能を深く理解し、AI が深く関与したワークフローを構築する必要があります。 「今日会社で働いていると、ワークフロー全体が非常に複雑になっています。ChatGPT は非常に強力ですが、エージェントのレベルには程遠いです。画期的な進歩は 1 つだけです。真に前進するには、ChatGPT をシステムに統合する必要があります。」ワークフロー全体です。」と彼は言いました。AI ガバナンスは非常に重要です。今年の世界人工知能会議 (WAIC) のテーマは、AI ガバナンスに関するものであり、この問題に関してはさまざまな国がさまざまな見解を持っています。 AI の発展は、人々、企業、政府の監督、社会開発などの側面に強い影響を与え、そのセキュリティ ガバナンスに対する国民の懸念を引き起こしています。 「人工知能の開発における次の重要なポイントは、世界中のさまざまな国の視点から見ると、主権型人工知能を構築する必要があり、主権型人工知能の背後には、主権型人工知能の開発をサポートするソブリンクラウドがなければなりません」人工知能」とシェン・シャンヤン氏は語った。「GPT によってもたらされる影響のうち、人間とコンピューターの相互作用による衝撃はどれくらいでしょうか。また、機械知能の発展はどれくらいでしょうか?」 Shen Xiangyang 氏は、人間と機械の関係を再考する必要があると考えています。同氏は、AIは人間にテクノロジーとの共生のための新たなコンテキストを提供し、人間とコンピューターのインタラクションの新しい方法は「AIとIA」の統合と進歩を示していると指摘した。 IA (Intelligent Augmentation) は、人間中心の AI 開発パスを表します。人間に取って代わるのではなく、テクノロジーを利用して人間の能力を強化することに重点を置き、人間とAIの協力関係を強調しています。 「ニューヨーク・タイムズ紙のコラムニスト、ジョン・マーコフ氏は、過去数十年間のコンピュータ開発において、真の勝者は人間とコンピュータの相互作用にあると述べた。テクノロジーが何であれ、最終的な目標は人間が機械をより良く使えるように支援することであるべきだ」と語った。 Shen Xiang Yang 氏は、「AI 時代において、人間とコンピューターの対話の最も重要な側面は、ChatGPT と同様に対話です。ChatGPT と Microsoft が AI 時代で最も偉大な企業になるのは時間だけだと思います。」教えて。"現在、GPT の開発が本格化していますが、実際のところ、知能に関する人々の理解はまだ非常に限られています。物理学とは異なり、広大な星空から小さな量子まですべてが統一理論で説明できますが、今日の深層学習の多くは説明不可能であり、堅牢性がありません。 「インテリジェンスの本質は、ニューラル ネットワークとシンボル システムの間の 1 世紀にわたる戦いです。今日、人工知能の開発はまだ比較的初期段階にありますが、業界ではすでに多くのアプリケーションが存在しています。」私はそれにふさわしいと決意しており、将来に自信を持っています。」