Alors que le premier chef-d'œuvre du jeu AAA national "Black Myth: Wukong" est devenu populaire dans le monde entier, le marché de la puissance de calcul spatial qui réalise une connexion transparente entre le monde physique et le monde virtuel derrière lui est rapidement devenu le nouveau favori de la capitale. marché. Sous la vague des grands modèles, d’énormes demandes de puissance de calcul sont apparues.
Dans le même temps, la construction d’infrastructures destinées à soutenir l’amélioration de la puissance de calcul a également attiré l’attention de l’industrie. Depuis 2024, les grands modèles d'IA sont entrés dans leur première année d'application.De plus en plus de banques commerciales ont continué d'augmenter leurs investissements dans la construction d'infrastructures de grands modèles, et les capacités de l'architecture de modèles multimodaux sont devenues une orientation clé pour la configuration des institutions financières.
La tendance des grands modèles multimodaux est mise en avant
Avec l'amélioration continue des capacités des grands modèles, depuis 2024, les banques et autres institutions financières ont augmenté l'application de scénarios et la construction écologique des grands modèles d'IA.
Récemment, un certain nombre de banques cotées ont divulgué les progrès réalisés dans la création de grandes plates-formes de modèles d'IA dans leurs rapports annuels. Le rapport semestriel de la China Merchants Bank montre que la banque a renforcé la construction systématique de grands modèles de langage et déployé des efforts complets dans des domaines tels que l'infrastructure, les plateformes de raisonnement et de formation, les algorithmes et les modèles, les cadres de développement d'applications et les applications de scénarios. Améliorer continuellement la construction de la plateforme interne d'expérience des grands modèles, renforcer la communication approfondie avec plus de 100 entreprises de la chaîne écologique des grands modèles, promouvoir la construction écologique interne et externe des grands modèles et accélérer l'application de technologies de pointe telles que l'IA. grands modèles dans l'entreprise.
La China Construction Bank a clairement indiqué dans son rapport semestriel qu'elle continuerait à promouvoir la construction et l'application de modèles financiers à grande échelle et à donner pleinement accès à 79 scénarios commerciaux en banque dans six secteurs majeurs : finance d'entreprise, finances personnelles, immobilisations. gestion, gestion des risques, canaux technologiques et gestion complète.
Le rapport semestriel de Ping An Bank a souligné qu'au cours du premier semestre, elle a développé de manière indépendante une plate-forme ouverte de grand modèle et renforcé la construction de capacités de base telles qu'une plate-forme de puissance de calcul, une grande base de modèles, le développement de grands modèles et l'intégration des opérations ( Ops), d'agents et de plateforme de développement d'applications.
Lors de la conférence 2024 du CMB Pujiang sur l'écologie financière numérique, Zhou Tianhong, directeur général du département des technologies de l'information et directeur de l'information désigné de la China Merchants Bank, a déclaré que les grands modèles deviendront le facteur le plus important affectant la société humaine et changeront profondément l'économie et la société des gens. et la vie dans le futur ; les banques exploreront également activement l’application de grands scénarios de modèles et continueront d’accélérer la mise en œuvre d’applications technologiques de pointe telles que les grands modèles d’IA.
La construction d’infrastructures de grands modèles d’IA et l’exploration d’applications de scénarios deviennent des éléments clés de la configuration de la technologie financière des banques.
Yu Wujie, directeur général adjoint du département des technologies de l'information du siège social de la China Merchants Bank, a révélé que la banque avait créé un laboratoire fin 2017 et avait commencé à mener des recherches sur divers aspects tels que la parole, le langage, la vision et les images à travers le étude des technologies traditionnelles. « Depuis le lancement de ChatGPT fin 2022, les banques ont investi davantage de ressources dans le domaine des grands modèles. Aujourd'hui, la China Merchants Bank a fait de la construction d'infrastructures et des applications de scénarios une direction d'investissement clé.
Dans le même temps, Yu Wujie a également souligné que le grand modèle de langage actuel a la capacité de comprendre, une certaine capacité de génération et une capacité de raisonnement logique préliminaire, mais n'a pas encore atteint le stade du raisonnement logique complexe et de la dérivation de principes. Au niveau de l'application des scénarios dans le secteur financier, Yu Wujie estime que le développement des grands modèles a traversé trois étapes : dans la première étape, de nombreux produits numériques ont été produits et les capacités des grands modèles ont été superposées aux produits pour améliorer l'efficacité. des processus commerciaux existants ; Dans la deuxième étape, les capacités de l'IA sont naturellement intégrées dans les applications générées, optimisant le processus du système de service client, permettant aux clients d'obtenir des services financiers par eux-mêmes. Dans la troisième étape, le grand modèle va tout remodeler, y compris le système d'exploitation sous-jacent, le modèle organisationnel, la division du travail des processus, etc., apportant un impact plus profond et essentiel.
À en juger par la pratique d'application des grands modèles dans les institutions financières, l'industrie actuelle en est généralement à la première et à la deuxième étape. Il convient de noter qu'à mesure que nous entrons dans la phase de développement des grands modèles d'IA, l'application des grands modèles a mis en avant des exigences plus élevées pour la construction d'infrastructures pour les grands modèles d'entreprise.
Liu Zhaoyang, expert principal en algorithme de la plateforme de grands modèles Alibaba Cloud Bailian, a déclaré qu'il existe plusieurs directions qui peuvent être explorées dans le développement de la technologie des grands modèles, parmi lesquelles un modèle multimodal unique qui prend en charge le langage, la voix et l'image. Les entrées simultanées constituent une tendance majeure. Il s'agit d'un ensemble de paradigmes techniques capables de traiter des entrées et des sorties multimodales telles que du texte, des images et des vidéos, y compris la compréhension et la génération d'images.
Selon le dernier « Rapport de recherche sur le développement technologique des grands modèles linguistiques d'intelligence artificielle (2024) » publié, les futurs grands modèles accorderont davantage d'attention à la fusion et au traitement des données multimodales et auront tendance à améliorer les capacités d'apprentissage adaptatif et de transfert. des algorithmes sont utilisés pour améliorer la transparence, permettant aux grands modèles de langage de mieux comprendre et de s'adapter à des environnements d'application pratiques complexes et changeants.
Cependant, Wang Guangrun, scientifique en chef de Tuoyuan Intelligence, a souligné que la plupart des modèles multimodaux actuels sont basés sur l'architecture technique d'il y a 7 ans. Bien que ces modèles aient fait certains progrès, ils présentent encore de nombreuses lacunes, notamment des niveaux élevés. coûts de formation et d'inférence, sujet aux hallucinations, peu doué pour la planification à long terme et incapable d'accomplir des tâches complexes de manière indépendante.
Wang Guangrun a révélé qu'en réponse à ces problèmes, Tuoyuan Intelligence a proposé des idées innovantes pour remodeler les fondations des grands modèles multimodaux grâce à une nouvelle architecture technique. "Cette architecture innovante réduit non seulement considérablement les coûts de formation et de test des grands modèles, mais abaisse également considérablement le seuil permettant aux petites et moyennes entreprises d'entrer dans l'ère des grands modèles, favorisant ainsi l'égalisation de la technologie."
La construction d’infrastructures informatiques s’accélère
Le développement et l’application de grands modèles dépendent fortement d’une puissance de calcul puissante. Liu Zhaoyang a déclaré que la puissance de calcul est la ressource la plus rare à notre époque. À l'ère d'aujourd'hui, la puissance de calcul deviendra fondamentalement la pierre angulaire du développement de chaque entreprise ou du développement de l'intelligence artificielle.
Gao Wen, académicien de l'Académie chinoise d'ingénierie, directeur du laboratoire Pengcheng et professeur de la chaire Boya à l'Université de Pékin, a souligné que le développement de modèles tels que le GPT repose sur le big data, les big models et une grande puissance de calcul ; est l'élément central de la compétitivité nationale et de la construction d'une puissance de calcul. Le réseau électrique est crucial et doit résoudre des défis tels que l'alimentation en énergie de calcul de base, les connexions de communication et la planification de la puissance de calcul pour promouvoir le développement et l'application de l'IA.
Dans ce contexte, de plus en plus d’entreprises de premier plan continuent d’investir davantage dans la construction d’infrastructures à grande échelle.
Chen Xi, directeur général adjoint du département des technologies de l'information du siège social de la China Merchants Bank, a révélé que la banque accélérait également actuellement la construction d'une plate-forme cloud d'IA pour fournir les capacités de base et une plate-forme de services modèle requise pour les applications commerciales d'IA, en se concentrant sur le cluster de formation et le cluster d'inférence construction d'infrastructures informatiques.
Chen Xi a déclaré que les « trois ans vers le cloud » mentionnés précédemment étaient un cloud complet. Avec l'émergence de grands modèles, la proportion d'informatique intelligente deviendra de plus en plus grande, et il ne s'agit pas seulement de la mise à niveau de l'infrastructure, mais implique également. développement de niveau supérieur.
Liu Zhaoyang a souligné qu'après que GPT aura commencé à réserver les grands modèles de Transformer en 2020 ou 2021, le nombre et l'échelle des grands modèles, ainsi que la demande de puissance de calcul et de données des grands modèles derrière eux, connaîtront une croissance exponentielle significative. s'orienter.
Dans le cadre d’une telle tendance, les grands modèles posent également de plus grands défis en matière de prise en charge de la puissance de calcul.
Zhou Wei, architecte en chef de Kunlun Core Financial, a souligné que le taux de croissance des besoins en puissance de calcul pour les grands modèles est bien supérieur au taux de croissance du matériel lui-même, ce qu'on appelle en même temps la loi de Moore ; Dans le contexte de concurrence entre la Chine et les États-Unis, en particulier les puces nationales, il y aura toujours des problèmes avec le cou coincé. "D'une manière générale, l'offre mondiale de puissance de calcul n'est pas satisfaite de la demande actuelle en logiciels."
En outre, Zhou Wei a également déclaré que la manière d'évaluer si une certaine puissance de calcul peut répondre à la demande dépend non seulement de la puissance de calcul elle-même, mais également d'indicateurs complets. Selon Zhou Wei, il est désormais généralement admis que la puissance de calcul n'est pas un simple indicateur tel qu'un simple calcul de nombres à virgule flottante ou de fréquence principale ou de nombre de cœurs. Il s'agit d'une valeur globale des différentes capacités matérielles en matière de calcul, de stockage et de communication.
Zhou Wei a souligné que afin de répondre aux besoins de pré-formation de grands modèles ou de réglage fin de la puissance de calcul, différentes puissances de calcul doivent être utilisées comme un pool de ressources informatiques mixtes hétérogènes, ainsi que des tâches de formation, des tâches d'inférence et des agents, Rag.
Tout en renforçant les investissements dans la construction d'infrastructures de puissance de calcul, certaines institutions financières ont également commencé à s'intéresser à l'amélioration des capacités d'innovation des talents en technologie financière afin de contribuer davantage à la construction de grands modèles d'IA et à l'exploration des pratiques d'application.
Zhou Tianhong a déclaré qu'en regardant vers l'avenir, après l'ère de la vapeur, de l'électricité et de l'information, la société humaine est sur le point d'entrer dans l'ère de l'intelligence ; seul l'épanouissement des applications technologiques peut promouvoir le développement global de « l'IA + la finance ».
Gao Xulei, directeur du bureau de développement de la finance numérique du siège social de la China Merchants Bank, a également révélé que la banque avait lancé le programme d'apprentissage de la finance numérique de Pujiang pour augmenter la fréquence et la densité des échanges et s'efforcer de créer des orientations plus innovantes. Selon Gao Xulei, l'innovation ne se produit pas de manière isolée, mais s'épanouit à l'intersection des idées, de l'expérience et de la culture dans un environnement approprié. « Dans la vague de la finance numérique, chacun est témoin, participant et créateur. J'espère que toutes les institutions financières pourront étudier conjointement les lois de développement de la finance numérique, essayer des modèles et des méthodes innovantes et promouvoir conjointement le développement et l'application de technologies de pointe. technologies financières numériques.