Da das erste inländische AAA-Spielemeisterwerk „Black Myth: Wukong“ auf der ganzen Welt populär geworden ist, ist der Markt für Weltraum-Rechenleistung, der die nahtlose Verbindung zwischen der physischen Welt und der dahinter liegenden virtuellen Welt realisiert, schnell zum neuen Favoriten der Hauptstadt geworden Markt. Durch die Welle großer Modelle ist ein enormer Bedarf an Rechenleistung entstanden.
Gleichzeitig hat auch der Infrastrukturbau zur Unterstützung der Verbesserung der Rechenleistung die Aufmerksamkeit der Branche auf sich gezogen. Seit 2024 sind große KI-Modelle in das erste Anwendungsjahr eingetreten. Immer mehr Geschäftsbanken investieren weiter in den Infrastrukturaufbau großer Modelle und werden zu einer Schlüsselrichtung für die Gestaltung von Finanzinstituten.
Der Trend zu multimodalen Großmodellen wird hervorgehoben
Mit der kontinuierlichen Verbesserung der Fähigkeiten großer Modelle haben Banken und andere Finanzinstitute seit 2024 die Szenarioanwendung und den ökologischen Aufbau großer KI-Modelle erhöht.
Kürzlich haben eine Reihe börsennotierter Banken in ihren Jahresberichten den Fortschritt beim Aufbau großer KI-Modellplattformen offengelegt. Der Halbjahresbericht der China Merchants Bank zeigt, dass die Bank den systematischen Aufbau großer Sprachmodelle gestärkt und umfassende Anstrengungen in Bereichen wie Infrastruktur, Argumentations- und Trainingsplattformen, Algorithmen und Modellen, Anwendungsentwicklungs-Frameworks und Szenarioanwendungen unternommen hat. Kontinuierliche Verbesserung des Aufbaus der internen Erlebnisplattform für große Modelle, Stärkung der intensiven Kommunikation mit mehr als 100 Unternehmen der großen ökologischen Modellkette, Förderung des internen und externen ökologischen Aufbaus großer Modelle und Beschleunigung der Anwendung modernster Technologien wie KI große Modelle im Unternehmen.
Die China Construction Bank machte in ihrem Halbjahresbericht deutlich, dass sie weiterhin den Aufbau und die Anwendung groß angelegter Finanzmodelle fördern und 79 bankinterne Geschäftsszenarien in sechs Hauptsektoren vollständig ermöglichen wird: Unternehmensfinanzierung, persönliche Finanzierung, Kapitalvermögen Management, Risikomanagement, Technologiekanäle und umfassendes Management.
Im Halbjahresbericht der Ping An Bank wurde darauf hingewiesen, dass sie in der ersten Jahreshälfte unabhängig eine offene Plattform für große Modelle entwickelt und den Aufbau grundlegender Fähigkeiten wie Rechenleistungsplattform, große Modellbasis, Entwicklung großer Modelle und Betriebsintegration gestärkt hat ( Ops), Agent und Anwendungsentwicklungsplattform.
Auf der CMB Pujiang Digital Financial Ecology Conference 2024 sagte Zhou Tianhong, General Manager der Abteilung Informationstechnologie und designierter Chief Information Officer der China Merchants Bank, dass große Modelle zum größten Einflussfaktor auf die menschliche Gesellschaft werden und die Wirtschaft und Gesellschaft der Menschen tiefgreifend verändern werden und das Leben in der Zukunft; Banken werden auch die Anwendung großer Modellszenarien aktiv erforschen und die Implementierung modernster Technologieanwendungen wie großer KI-Modelle weiter beschleunigen.
Der Aufbau großer KI-Infrastrukturen und die Erforschung von Anwendungsszenarien werden zu zentralen Schwerpunkten im Finanztechnologie-Layout von Banken.
Yu Wujie, stellvertretender Generaldirektor der Informationstechnologieabteilung des Hauptsitzes der China Merchants Bank, gab bekannt, dass die Bank Ende 2017 ein Labor eingerichtet und damit begonnen habe, Forschungen zu verschiedenen Aspekten wie Sprache, Sprache, Sehen und Bildern durchzuführen Studium traditioneller Technologien. „Seit der Einführung von ChatGPT Ende 2022 haben Banken mehr Ressourcen in den Bereich großer Modelle investiert. Jetzt hat die China Merchants Bank den Infrastrukturbau und Szenarioanwendungen zu einer wichtigen Investitionsrichtung gemacht.“
Gleichzeitig wies Yu Wujie auch darauf hin, dass das aktuelle große Sprachmodell über die Fähigkeit zum Verstehen, eine gewisse Generierungsfähigkeit und die Fähigkeit zum vorläufigen logischen Denken verfügt, aber noch nicht das Stadium des komplexen logischen Denkens und der Prinzipienableitung erreicht hat. Auf der Ebene der Szenarioanwendung in der Finanzbranche ist Yu Wujie der Ansicht, dass die Entwicklung großer Modelle drei Phasen durchlaufen hat: In der ersten Phase wurden viele digitale Produkte hergestellt und den Produkten große Modellfunktionen überlagert, um die Effizienz zu verbessern der bestehenden Geschäftsprozesse; in der zweiten Stufe werden die Fähigkeiten der KI auf natürliche Weise in die generierten Anwendungen integriert, wodurch der Kundendienstsystemprozess optimiert wird und es den Kunden ermöglicht wird, in der dritten Stufe alles neu zu gestalten; einschließlich des zugrunde liegenden Betriebssystems, des Organisationsmodells, der prozessualen Arbeitsteilung usw., was eine tiefgreifendere und wesentlichere Wirkung hat.
Gemessen an der Anwendungspraxis großer Modelle in Finanzinstituten befindet sich die aktuelle Branche im Allgemeinen in der ersten und zweiten Phase. Es ist erwähnenswert, dass mit dem Eintritt in die Entwicklungsphase großer KI-Modelle die Anwendung großer Modelle höhere Anforderungen an den Infrastrukturaufbau großer Unternehmensmodelle gestellt hat.
Liu Zhaoyang, leitender Algorithmusexperte der Alibaba Cloud Bailian Large Model Platform, sagte, dass es bei der Entwicklung der Großmodelltechnologie mehrere Richtungen gibt, darunter eines für alle multimodalen Modelle, die Sprache, Sprache und Bild unterstützen Gleichzeitig sind Eingaben ein wichtiger Trend. Hierbei handelt es sich um eine Reihe von technischen Paradigmen, die in der Lage sind, multimodale Eingaben und Ausgaben wie Text, Bilder und Videos zu verarbeiten, einschließlich Bildverständnis und -generierung.
Laut dem neuesten veröffentlichten Forschungsbericht „Artificial Intelligence Large Language Model Technology Development (2024)“ werden zukünftige große Modelle der Fusion und Verarbeitung multimodaler Daten mehr Aufmerksamkeit schenken und tendenziell die adaptiven und transferierbaren Lernfähigkeiten verbessern Algorithmen werden verwendet, um die Transparenz zu verbessern und es großen Sprachmodellen zu ermöglichen, komplexe und veränderliche praktische Anwendungsumgebungen besser zu verstehen und sich an sie anzupassen.
Wang Guangrun, Chefwissenschaftler von Tuoyuan Intelligence, wies jedoch darauf hin, dass die meisten aktuellen multimodalen Modelle auf der technischen Architektur von vor 7 Jahren basieren. Obwohl diese Modelle gewisse Fortschritte gemacht haben, weisen sie immer noch viele Mängel auf, wie z Schulungs- und Schlussfolgerungskosten, anfällig für Halluzinationen, nicht gut in der langfristigen Planung und nicht in der Lage, komplexe Aufgaben selbstständig zu erledigen.
Wang Guangrun enthüllte, dass Tuoyuan Intelligence als Reaktion auf diese Probleme innovative Ideen vorschlug, um die Grundlage multimodaler Großmodelle durch eine neue technische Architektur neu zu gestalten. „Diese innovative Architektur reduziert nicht nur die Schulungs- und Testkosten großer Modelle erheblich, sondern senkt auch die Schwelle für kleine und mittlere Unternehmen, in die Ära großer Modelle einzutreten, erheblich und fördert so die Angleichung der Technologie.“
Der Bau der Computerinfrastruktur beschleunigt sich
Die Entwicklung und Anwendung großer Modelle hängt in hohem Maße von einer leistungsstarken Rechenleistungsunterstützung ab. Liu Zhaoyang sagte, dass Rechenleistung heutzutage die knappste Ressource sei. In der heutigen Zeit werde Rechenleistung im Grunde zum größten Eckpfeiler für die Entwicklung jedes Unternehmens oder die Entwicklung künstlicher Intelligenz werden.
Gao Wen, Akademiker der Chinesischen Akademie für Ingenieurwissenschaften, Direktor des Pengcheng-Labors und Boya-Lehrstuhlprofessor an der Peking-Universität, betonte, dass die Entwicklung von Modellen wie GPT auf großen Datenmengen, großen Modellen und großer Rechenleistung beruht; ist das Kernelement der nationalen Wettbewerbsfähigkeit und des Aufbaus von Rechenleistung. Das Stromnetz ist von entscheidender Bedeutung und muss Herausforderungen wie die Stromversorgung der Kernrechen, Kommunikationsverbindungen und die Planung der Rechenleistung lösen, um die Entwicklung und Anwendung von KI zu fördern.
Vor diesem Hintergrund erhöhen immer mehr führende Unternehmen weiterhin ihre Investitionen in den groß angelegten Infrastrukturbau.
Chen Xi, stellvertretender Generaldirektor der Informationstechnologieabteilung des Hauptsitzes der China Merchants Bank, gab bekannt, dass die Bank derzeit auch den Aufbau einer KI-Cloud-Plattform beschleunigt, um die grundlegenden Funktionen und Modelldienstplattformen bereitzustellen, die für KI-Geschäftsanwendungen erforderlich sind der Trainingscluster und der Inferenzcluster Aufbau der Computerinfrastruktur.
Chen Xi sagte, dass die zuvor erwähnten „drei Jahre bis zur Cloud“ eine umfassende Cloud seien. Mit dem Aufkommen großer Modelle werde der Anteil intelligenter Computer immer größer, und dies bedeute nicht nur die Modernisierung der Infrastruktur, sondern auch die Modernisierung der Infrastruktur Paradigmenwechsel auf höherer Ebene.
Liu Zhaoyang wies darauf hin, dass, nachdem GPT im Jahr 2020 oder 2021 mit der Reservierung großer Transformer-Modelle beginnt, sowohl die Anzahl und der Umfang der großen Modelle als auch die Nachfrage nach Rechenleistung und Daten der dahinter stehenden großen Modelle ein deutliches exponentielles Wachstum verzeichnen werden. Trend.
Bei einem solchen Trend bringen große Modelle auch größere Herausforderungen an die Rechenleistungsunterstützung mit sich.
Zhou Wei, Chefarchitekt von Kunlun Core Financial, wies darauf hin, dass die Wachstumsrate des Rechenleistungsbedarfs für große Modelle viel größer sei als die Wachstumsrate der Hardware selbst, was gleichzeitig das sogenannte Mooresche Gesetz sei; Im Kontext des Wettbewerbs zwischen China und den Vereinigten Staaten, insbesondere inländischen Chips, wird es immer noch Probleme mit dem Feststecken des Halses geben. „Im Allgemeinen ist das weltweite Rechenleistungsangebot also nicht mit der aktuellen Softwarenachfrage zufrieden.“
Darüber hinaus sagte Zhou Wei auch, dass die Beurteilung, ob eine bestimmte Rechenleistung den Bedarf decken kann, nicht nur von der Rechenleistung selbst, sondern auch von umfassenden Indikatoren abhängt. Nach Ansicht von Zhou Wei ist es mittlerweile allgemein anerkannt, dass es sich bei der Rechenleistung nicht um einen einfachen Indikator wie eine einfache Berechnung von Gleitkommazahlen oder Hauptfrequenzen oder Kernzahlen handelt, sondern um einen umfassenden Wert verschiedener Hardwarefunktionen in den Bereichen Computer, Speicherung und Kommunikation.
Zhou Wei betonte, dass zur Erfüllung der Anforderungen des Vortrainings großer Modelle oder der Feinabstimmung der Rechenleistung unterschiedliche Rechenleistungen als heterogener gemischter Rechenressourcenpool sowie Trainingsaufgaben, Inferenzaufgaben und Agenten verwendet werden müssen.
Während einige Finanzinstitute verstärkt in den Aufbau einer Rechenleistungsinfrastruktur investieren, haben sie auch begonnen, ihr Augenmerk auf die Verbesserung der Innovationsfähigkeiten von Finanztechnologietalenten zu richten, um den Aufbau großer KI-Modelle und die Erforschung der Anwendungspraxis weiter zu unterstützen.
Zhou Tianhong sagte, mit Blick auf die Zukunft stehe die menschliche Gesellschaft nach dem Dampfzeitalter, dem Elektrozeitalter und dem Informationszeitalter kurz vor dem Eintritt in das intelligente Zeitalter. Nur das Aufblühen von Technologieanwendungen könne die Gesamtentwicklung von „KI + Finanzen“ fördern.
Gao Xulei, Direktor des Digital Finance Development Office der Zentrale der China Merchants Bank, gab außerdem bekannt, dass die Bank das Pujiang Digital Finance Learning Program ins Leben gerufen hat, um die Häufigkeit und Dichte des Austauschs zu erhöhen und sich um die Schaffung innovativerer Richtungen zu bemühen. Nach Ansicht von Gao Xulei entsteht Innovation nicht isoliert, sondern gedeiht an der Schnittstelle von Ideen, Erfahrung und Kultur in einem geeigneten Umfeld. „In der Welle des digitalen Finanzwesens ist jeder Zeuge, Teilnehmer und Schöpfer. Ich hoffe, dass alle Finanzinstitute gemeinsam die Entwicklungsgesetze des digitalen Finanzwesens studieren, innovative Modelle und Methoden ausprobieren und gemeinsam die Entwicklung und Anwendung modernster Technologien fördern können.“ digitale Finanztechnologien.“