初の国産 AAA ゲームの傑作「Black Myth: Wukong」が世界中で人気を博す中、物理世界とその背後にある仮想世界の間のシームレスな接続を実現するスペース コンピューティング パワー市場は急速に首都の新たなお気に入りになりました。市場。大型モデルの波を受けて、コンピューティング能力に対する膨大な需要が生じています。
同時に、コンピューティング能力の向上を支えるインフラ構築も業界の注目を集めています。 2024 年以降、AI 大型モデルの適用初年度を迎え、ますます多くの商業銀行が大型モデルのインフラストラクチャ構築への投資を増やし続けており、マルチモーダル モデル アーキテクチャ機能が金融機関のレイアウトの重要な方向性となっています。
マルチモーダル大型モデルのトレンドが浮き彫りに
大規模モデルの機能が継続的に改善されているため、2024 年以降、銀行やその他の金融機関は AI 大規模モデルのシナリオ アプリケーションとエコロジカルな構築を増やしています。
最近、多くの上場銀行が年次報告書でAI大型モデルプラットフォーム構築の進捗状況を開示している。中国招商銀行の半期報告書によると、同銀行は大規模な言語モデルの体系的な構築を強化し、インフラストラクチャ、推論とトレーニングのプラットフォーム、アルゴリズムとモデル、アプリケーション開発フレームワーク、シナリオアプリケーションなどの分野で包括的な取り組みを行ってきた。内部大型モデル体験プラットフォームの構築を継続的に改善し、100社以上の大型モデル生態チェーン企業との綿密なコミュニケーションを強化し、大型モデルの内部および外部の生態学的構築を促進し、AIなどの最先端技術の応用を加速します。社内にある大型モデル。
中国建設銀行は半期報告書の中で、今後も大規模な金融モデルの構築と適用を推進し、企業金融、個人金融、資本資産の6つの主要セクターにおける79の銀行内ビジネスシナリオを全面的に強化することを明らかにした。経営管理、リスク管理、技術チャネル、総合管理。
平安銀行の半期報告書は、今年上半期に大規模モデルオープンプラットフォームを独自に開発し、コンピューティングパワープラットフォーム、大規模モデルベース、大規模モデル開発、運用統合などの基本機能の構築を強化したと指摘した( Ops)、エージェント、およびアプリケーション開発プラットフォーム。
2024年CMB浦江デジタル金融エコロジーカンファレンスで、中国招商銀行情報技術部長兼最高情報責任者に任命された周天紅氏は、大型モデルが人間社会に影響を与える最大の要因となり、人々の経済、社会を大きく変えるだろうと述べた。銀行はまた、大規模モデルのシナリオの適用を積極的に検討し、AI の大規模モデルなどの最先端テクノロジーのアプリケーションの実装を加速し続けます。
AI の大規模モデル インフラストラクチャの構築とシナリオ アプリケーションの探索は、銀行の金融テクノロジー レイアウトの重要な焦点になりつつあります。
中国招商銀行本店情報技術部副部長のYu Wujie氏は、同銀行が2017年末に研究所を設立し、音声、言語、視覚、画像などのさまざまな側面の研究を開始したことを明らかにした。伝統的な技術の研究。 「2022年末にChatGPTを開始して以来、銀行は大型モデルの分野により多くのリソースを投資してきました。現在、招商銀行はインフラストラクチャ構築とシナリオアプリケーションを主要な投資方向に据えています。」
同時に、Yu Wujie氏は、現在の大規模言語モデルは理解能力、一定の生成能力、予備的な論理推論能力を備えているが、複雑な論理推論と原理導出の段階にはまだ達していないと指摘した。 Yu Wujie 氏は、金融業界におけるシナリオ アプリケーションのレベルでは、大規模モデルの開発は 3 つの段階を経たと考えています。第 1 段階では、多くのデジタル製品が作成され、効率を向上させるために大規模なモデルの機能が製品に重ねられました。第 2 段階では、AI の機能が生成されたアプリケーションに自然に統合され、顧客サービス システム プロセスが最適化され、第 3 段階では、大規模なモデルがすべてを再構築します。これには、基礎となるオペレーティング システム、組織モデル、プロセスの分業などが含まれ、より深刻かつ本質的な影響をもたらします。
金融機関における大規模モデルの適用事例から判断すると、現在の業界は一般に第 1 段階と第 2 段階にあります。 AI大規模モデルの開発段階に入ると、大規模モデルのアプリケーションにより、エンタープライズ大規模モデルのインフラストラクチャ構築に対する要件がさらに高まっていることは注目に値します。
Alibaba Cloud Bailian Large Model Platform の上級アルゴリズム専門家である Liu Zhaoyang 氏は、大規模モデル技術の開発にはいくつかの方向性があり、その中には言語、音声、画像をサポートする One for all マルチモーダル モデルがあると述べました。これは、画像の理解と生成を含む、テキスト、画像、ビデオなどのマルチモーダルな入出力を処理できる一連の技術パラダイムです。
発表された最新の「人工知能大規模言語モデル技術開発研究報告書(2024年)」によると、将来の大規模モデルはマルチモーダルデータの融合と処理にさらに注目し、適応学習と転移学習の能力を向上させる傾向にあるとしている。アルゴリズムは透明性を向上させるために使用され、大規模な言語モデルが複雑で変化しやすい実際のアプリケーション環境をよりよく理解し、適応できるようにします。
しかし、Tuoyuan Intelligence の首席科学者である Wang Guangrun 氏は、現在のマルチモーダル モデルのほとんどは 7 年前の技術アーキテクチャに基づいていると指摘しました。これらのモデルは一定の進歩を遂げていますが、依然として高いなどの多くの欠点があります。トレーニングと推論のコストがかかり、幻覚に悩まされやすく、長期的な計画が苦手で、複雑なタスクを単独で完了することができません。
Wang Guangrun 氏は、これらの問題に対応して、Tuoyuan Intelligence が新しい技術アーキテクチャを通じてマルチモーダル大規模モデルの基盤を再構築する革新的なアイデアを提案したことを明らかにしました。 「この革新的なアーキテクチャは、大規模モデルのトレーニングとテストのコストを大幅に削減するだけでなく、中小企業が大規模モデルの時代に入る敷居を大幅に下げ、テクノロジーの均等化を促進します。」
コンピューティングインフラストラクチャの構築がスピードアップ
大規模モデルの開発と適用は、強力なコンピューティング能力のサポートに大きく依存します。 Liu Zhaoyang氏は、コンピューティングパワーはこの時代で最も不足しているリソースであり、基本的にコンピューティングパワーはあらゆる企業の発展や人工知能の発展にとって最大の基礎となるだろうと述べた。
中国工程院の学者で彭城研究所所長、北京大学のボヤ教授でもあるガオ・ウェン氏は、GPTなどのモデルの開発はビッグデータ、ビッグモデル、大規模な計算能力に依存していると強調した。は国家競争力の中核要素であり、コンピューティング能力の構築です。電力ネットワークは極めて重要であり、AI の開発と応用を促進するために、コアのコンピューティング電源、通信接続、コンピューティング能力のスケジューリングなどの課題を解決する必要があります。
こうした背景から、大規模なインフラ建設への投資を増やす大手企業が増え続けている。
中国招商銀行本店情報技術部副部長の陳熙氏は、同銀行が現在、AIビジネスアプリケーションに必要な基本機能とモデルサービスプラットフォームを提供するAIクラウドプラットフォームの構築を加速していることを明らかにした。トレーニング クラスターと推論クラスターの構築。
Chen Xi 氏は、前述の「クラウドへの 3 年」は包括的なクラウドであり、大規模なモデルの登場により、インテリジェント コンピューティングの割合はますます大きくなり、インフラのアップグレードだけでなく、それも含まれると述べました。より高いレベルの開発のパラダイムが変わります。
Liu Zhaoyang 氏は、GPT が 2020 年または 2021 年に Transformer の大規模モデルの予約を開始すると、大規模モデルの数と規模、およびその背後にある大規模モデルのコンピューティング能力とデータの需要が大幅な指数関数的な増加を示すと指摘しました。傾向。
このような傾向の下では、大規模なモデルは、コンピューティング能力のサポートに対して大きな課題ももたらします。
Kunlun Core Financial のチーフアーキテクトである Zhou Wei 氏は、大規模モデルのコンピューティング能力要件の増加率は、いわゆるムーアの法則であると同時に、ハードウェア自体の増加率よりもはるかに大きいと指摘しました。中国と米国の間の競争の文脈では、特に国産チップは依然として首に引っかかる問題が発生するだろう。 「一般的に言って、世界のコンピューティング電力供給は現在のソフトウェア需要を満たしていません。」
さらに、Zhou Wei氏は、特定のコンピューティング能力が需要に対応できるかどうかを評価する方法は、コンピューティング能力そのものだけでなく、総合的な指標にも依存すると述べた。 Zhou Wei氏の見解では、コンピューティング能力は、浮動小数点数やメイン周波数、コア数などの単純な指標ではなく、コンピューティング、ストレージ、通信におけるさまざまなハードウェア能力の総合的な値であることが現在一般に受け入れられています。
Zhou Wei氏は、大規模モデルの事前トレーニングやコンピューティング能力の微調整のニーズを満たすためには、異なるコンピューティング能力を異種混合コンピューティングリソースプール、トレーニングタスク、推論タスク、エージェント、ラグとして使用する必要があると強調した。
一部の金融機関は、コンピューティングパワーインフラストラクチャの構築への投資を強化する一方で、AIの大規模モデルの構築とアプリケーション実践の探索をさらに支援するために、金融テクノロジー人材のイノベーション能力の向上にも注目し始めています。
周天紅氏は、将来に目を向けると、蒸気時代、電気時代、情報時代を経て、人類社会はインテリジェント時代に入ろうとしている、技術応用の隆盛だけが「AI + 金融」の全体的な発展を促進できると述べた。
中国招商銀行本店デジタル金融開発室長のGao Xulei氏はまた、同銀行が交換の頻度と密度を高め、より革新的な方向性の創出に努めるために浦江デジタル金融学習プログラムを立ち上げたことを明らかにした。 Gao Xulei 氏の見解では、イノベーションは単独で発生するものではなく、適切な環境でアイデア、経験、文化が交差することで開花します。 「デジタル金融の波では、誰もが目撃者であり、参加者であり、創造者です。すべての金融機関がデジタル金融の発展法則を共同で研究し、革新的なモデルと手法を試し、最先端の金融の開発と応用を共同で推進できることを願っています」デジタル金融テクノロジー。」