A medida que la primera obra maestra nacional del juego AAA, "Black Myth: Wukong", se ha vuelto popular en todo el mundo, el mercado de potencia de computación espacial que realiza la conexión perfecta entre el mundo físico y el mundo virtual detrás de él se ha convertido rápidamente en el nuevo favorito de la capital. mercado. Bajo la ola de modelos grandes, han surgido enormes demandas de potencia informática.
Al mismo tiempo, la construcción de infraestructura para apoyar la mejora de la potencia informática también ha atraído la atención de la industria. Desde 2024, los grandes modelos de IA han entrado en el primer año de aplicación. Cada vez más bancos comerciales han seguido aumentando la inversión en la construcción de infraestructura de grandes modelos. Las capacidades de la arquitectura de modelos multimodales se están convirtiendo en una dirección clave para el diseño de las instituciones financieras.
Se destaca la tendencia de los grandes modelos multimodales
Con la mejora continua de las capacidades de los grandes modelos, desde 2024, los bancos y otras instituciones financieras han aumentado la aplicación de escenarios y la construcción ecológica de los grandes modelos de IA.
Recientemente, varios bancos que cotizan en bolsa han revelado en sus informes anuales el progreso en la construcción de grandes plataformas modelo de IA. El informe semestral del China Merchants Bank muestra que el banco ha fortalecido la construcción sistemática de grandes modelos de lenguaje y ha realizado esfuerzos integrales en áreas como infraestructura, plataformas de razonamiento y capacitación, algoritmos y modelos, marcos de desarrollo de aplicaciones y aplicaciones de escenarios. Mejorar continuamente la construcción de la plataforma interna de experiencia de modelos grandes, fortalecer la comunicación en profundidad con más de 100 empresas de cadenas ecológicas de modelos grandes, promover la construcción ecológica interna y externa de modelos grandes y acelerar la aplicación de tecnologías de vanguardia como la IA. Modelos grandes en la empresa.
China Construction Bank dejó claro en su informe semestral que continuará promoviendo la construcción y aplicación de modelos financieros a gran escala y potenciará plenamente 79 escenarios de negocios bancarios en seis sectores principales: finanzas corporativas, finanzas personales y activos de capital. gestión, gestión de riesgos, canales tecnológicos y gestión integral.
El informe semestral de Ping An Bank señaló que en la primera mitad del año, desarrolló de forma independiente una plataforma abierta de modelo grande y fortaleció la construcción de capacidades básicas como plataforma de potencia informática, base de modelo grande, desarrollo de modelo grande e integración de operaciones ( Ops), agente y plataforma de desarrollo de aplicaciones.
En la Conferencia de Ecología Financiera Digital de CMB Pujiang de 2024, Zhou Tianhong, gerente general del Departamento de Tecnología de la Información y director de información designado del China Merchants Bank, dijo que los modelos grandes se convertirán en el factor más importante que afectará a la sociedad humana y cambiarán profundamente la economía y la sociedad de las personas. y los métodos de vida en el futuro; los bancos también explorarán activamente la aplicación de grandes escenarios de modelos y continuarán acelerando la implementación de aplicaciones de tecnología de vanguardia, como los grandes modelos de IA.
La construcción de infraestructuras de modelos grandes de IA y la exploración de aplicaciones de escenarios se están convirtiendo en focos clave del diseño de la tecnología financiera de los bancos.
Yu Wujie, subdirector general del Departamento de Tecnología de la Información de la oficina central del China Merchants Bank, reveló que el banco estableció un laboratorio a finales de 2017 y comenzó a realizar investigaciones en diversos aspectos como el habla, el lenguaje, la visión y las imágenes a través del estudio de tecnologías tradicionales. "Desde el lanzamiento de ChatGPT a finales de 2022, los bancos han invertido más recursos en el campo de los modelos grandes. Ahora China Merchants Bank ha hecho de la construcción de infraestructura y las aplicaciones de escenarios una dirección de inversión clave".
Al mismo tiempo, Yu Wujie también señaló que el modelo de lenguaje grande actual tiene capacidad de comprensión, cierta capacidad de generación y capacidad de razonamiento lógico preliminar, pero aún no ha alcanzado la etapa de razonamiento lógico complejo y derivación de principios. En el nivel de aplicación de escenarios en la industria financiera, Yu Wujie cree que el desarrollo de modelos grandes ha pasado por tres etapas: en la primera etapa, se produjeron muchos productos digitales y se superpusieron capacidades de modelos grandes a los productos para mejorar la eficiencia. de los procesos comerciales existentes, en la segunda etapa, las capacidades de la IA se integran naturalmente en las aplicaciones generadas, optimizando el proceso del sistema de servicio al cliente, permitiendo a los clientes obtener servicios financieros por sí mismos; en la tercera etapa, el modelo grande remodelará todo; incluyendo el sistema operativo subyacente, el modelo organizacional, la división del trabajo por procesos, etc., lo que lleva a tener un impacto más profundo y esencial.
A juzgar por la práctica de aplicación de modelos grandes en instituciones financieras, la industria actual generalmente se encuentra en la primera y segunda etapa. Vale la pena señalar que a medida que entramos en la etapa de desarrollo de modelos grandes de IA, la aplicación de modelos grandes ha planteado requisitos más altos para la construcción de infraestructura de modelos grandes empresariales.
Liu Zhaoyang, experto senior en algoritmos de Alibaba Cloud Bailian Large Model Platform, dijo que hay varias direcciones que se pueden explorar en el desarrollo de tecnología de modelos grandes, entre ellas, uno para todos los modelos multimodales que admiten lenguaje, voz e imagen. La entrada al mismo tiempo es una tendencia importante. Este es un conjunto de Un paradigma técnico capaz de procesar entradas y salidas multimodales, como texto, imágenes y videos, incluida la comprensión y generación de imágenes.
Según el último "Informe de investigación sobre el desarrollo de la tecnología de modelos de lenguajes grandes de inteligencia artificial (2024)" publicado, los modelos grandes del futuro prestarán más atención a la fusión y el procesamiento de datos multimodales y tenderán a mejorar la capacidad de aprendizaje adaptativo y de transferencia. Los algoritmos se utilizan para mejorar la transparencia, lo que permite que los modelos de lenguaje grandes comprendan y se adapten mejor a entornos de aplicaciones prácticas complejos y cambiantes.
Sin embargo, Wang Guangrun, científico jefe de Tuoyuan Intelligence, señaló que la mayoría de los modelos multimodales actuales se basan en la arquitectura técnica de hace 7 años. Aunque estos modelos han logrado ciertos avances, todavía tienen muchas deficiencias, como altas. Costos de capacitación e inferencia, propenso a alucinaciones, no es bueno para la planificación a largo plazo e incapaz de completar tareas complejas de forma independiente.
Wang Guangrun reveló que en respuesta a estos problemas, Tuoyuan Intelligence propuso ideas innovadoras para remodelar la base de grandes modelos multimodales a través de una nueva arquitectura técnica. "Esta arquitectura innovadora no sólo reduce significativamente los costos de capacitación y prueba de modelos grandes, sino que también reduce significativamente el umbral para que las pequeñas y medianas empresas entren en la era de los modelos grandes, promoviendo así la igualación de la tecnología".
Se acelera la construcción de infraestructura informática
El desarrollo y la aplicación de modelos grandes dependen en gran medida de un potente soporte de potencia informática. Liu Zhaoyang dijo que la potencia informática es el recurso más escaso en esta era. En la era actual, la potencia informática se convertirá básicamente en la piedra angular más importante para el desarrollo de cada empresa o el desarrollo de la inteligencia artificial.
Gao Wen, académico de la Academia de Ingeniería de China, director del Laboratorio Pengcheng y profesor de la cátedra Boya en la Universidad de Pekín, enfatizó que el desarrollo de modelos como GPT se basa en grandes datos, grandes modelos y una gran potencia informática; es el elemento central de la competitividad nacional y la construcción de potencia informática. La red eléctrica es crucial y necesita resolver desafíos como el suministro de energía informática central, las conexiones de comunicación y la programación de la potencia informática para promover el desarrollo y la aplicación de la IA.
En este contexto, cada vez más empresas líderes siguen aumentando la inversión en la construcción de infraestructuras a gran escala.
Chen Xi, subdirector general del Departamento de Tecnología de la Información de la oficina central de China Merchants Bank, reveló que el banco también está acelerando actualmente la construcción de una plataforma de nube de IA para proporcionar las capacidades básicas y la plataforma de servicios modelo necesarias para las aplicaciones comerciales de IA, centrándose en el cluster de formación y el cluster de inferencia.
Chen Xi dijo que los "tres años hasta la nube" mencionados anteriormente fueron una nube integral. Con la aparición de modelos grandes, la proporción de computación inteligente será cada vez mayor, y no se trata solo de la actualización de la infraestructura, sino que también implica. Desarrollo de alto nivel.
Liu Zhaoyang señaló que después de que GPT comience a reservar modelos grandes de Transformer en 2020 o 2021, tanto el número como la escala de los modelos grandes, así como la demanda de potencia informática y datos de los modelos grandes detrás de ellos, mostrarán un crecimiento exponencial significativo. tendencia.
Bajo tal tendencia, los modelos grandes también plantean mayores desafíos para el soporte de potencia informática.
Zhou Wei, arquitecto jefe de Kunlun Core Financial, señaló que la tasa de crecimiento de los requisitos de potencia informática para modelos grandes es mucho mayor que la tasa de crecimiento del hardware en sí, que es al mismo tiempo la llamada Ley de Moore; En el contexto de competencia entre China y Estados Unidos, especialmente los chips nacionales, todavía habrá problemas con el cuello atascado. "En términos generales, la oferta mundial de potencia informática no está satisfecha con la demanda actual de software".
Además, Zhou Wei también dijo que la forma de evaluar si una determinada potencia informática puede satisfacer la demanda depende no solo de la potencia informática en sí, sino también de indicadores integrales. En opinión de Zhou Wei, ahora se acepta generalmente que la potencia informática no es un simple indicador, como un simple cálculo de números de punto flotante o frecuencia principal o número central, sino un valor integral de diferentes capacidades de hardware en informática, almacenamiento y comunicación.
Zhou Wei enfatizó que para satisfacer las necesidades de preentrenamiento de modelos grandes o ajuste fino de la potencia informática, se deben utilizar diferentes potencias informáticas como un grupo heterogéneo de recursos informáticos mixtos y tareas de capacitación, tareas de inferencia y Agente, Rag.
Al tiempo que fortalecen la inversión en la construcción de infraestructura de potencia informática, algunas instituciones financieras también han comenzado a prestar atención a la mejora de las capacidades de innovación de los talentos de la tecnología financiera para ayudar aún más a la construcción de grandes modelos de IA y la exploración de prácticas de aplicaciones.
Zhou Tianhong dijo que mirando hacia el futuro, después de la era del vapor, la era eléctrica y la era de la información, la sociedad humana está a punto de entrar en la era inteligente; sólo el florecimiento de las aplicaciones tecnológicas puede promover el desarrollo general de la "IA + finanzas".
Gao Xulei, director de la Oficina de Desarrollo de Finanzas Digitales de la oficina central del China Merchants Bank, también reveló que el banco lanzó el Programa de Aprendizaje de Finanzas Digitales de Pujiang para aumentar la frecuencia y densidad de los intercambios y esforzarse por crear direcciones más innovadoras. En opinión de Gao Xulei, la innovación no ocurre de forma aislada, sino que florece en la intersección de ideas, experiencia y cultura en un entorno adecuado. "En la ola de las finanzas digitales, todos son testigos, participantes y creadores. Espero que todas las instituciones financieras puedan estudiar conjuntamente las leyes de desarrollo de las finanzas digitales, probar modelos y métodos innovadores y promover conjuntamente el desarrollo y la aplicación de tecnologías de vanguardia. tecnologías de finanzas digitales."