Поскольку первый отечественный шедевр игры ААА «Черный миф: Вуконг» стал популярным во всем мире, рынок космических вычислительных мощностей, реализующий бесшовную связь между физическим миром и виртуальным миром, стоящим за ним, быстро стал новым фаворитом столицы. рынок. На волне больших моделей возникли огромные требования к вычислительной мощности.
В то же время строительство инфраструктуры для поддержки повышения вычислительной мощности также привлекло внимание отрасли. С 2024 года большие модели ИИ вступили в первый год применения. Все больше и больше коммерческих банков продолжают увеличивать инвестиции в построение инфраструктуры больших моделей. Возможности мультимодальной архитектуры моделей становятся ключевым направлением компоновки финансовых учреждений.
Выделена тенденция мультимодальных крупных моделей.
Благодаря постоянному совершенствованию возможностей больших моделей с 2024 года банки и другие финансовые учреждения расширили возможности применения сценариев и экологического построения больших моделей ИИ.
Недавно ряд котирующихся на бирже банков раскрыли в своих годовых отчетах прогресс в создании платформ крупных моделей искусственного интеллекта. Полугодовой отчет China Merchants Bank показывает, что банк усилил систематическое построение крупных языковых моделей и предпринял комплексные усилия в таких областях, как инфраструктура, платформы рассуждения и обучения, алгоритмы и модели, среды разработки приложений и сценарные приложения. Постоянно совершенствовать построение внутренней платформы для работы с большими моделями, укреплять углубленную связь с более чем 100 крупными компаниями, занимающимися экологическими моделями, продвигать внутреннее и внешнее экологическое конструирование больших моделей и ускорять применение передовых технологий, таких как искусственный интеллект. большие модели в компании.
Строительный банк Китая ясно дал понять в своем полугодовом отчете, что он будет продолжать способствовать созданию и применению крупномасштабных финансовых моделей и полностью расширять возможности 79 внутрибанковских бизнес-сценариев в шести основных секторах: корпоративные финансы, личные финансы, капитальные активы. менеджмент, управление рисками, технологические каналы и комплексное управление.
В полугодовом отчете Ping An Bank отмечалось, что в первой половине года он самостоятельно разработал открытую платформу больших моделей и укрепил создание основных возможностей, таких как платформа вычислительной мощности, база больших моделей, разработка больших моделей и операционная интеграция ( Ops), агент и платформа разработки приложений.
На конференции CMB Pujiang по цифровой финансовой экологии 2024 года Чжоу Тяньхун, генеральный менеджер отдела информационных технологий и назначенный директор по информационным технологиям China Merchants Bank, заявил, что большие модели станут крупнейшим фактором, влияющим на человеческое общество, и глубоко изменят экономику людей, общество. и жизнь в будущем; банки также будут активно изучать возможности применения сценариев больших моделей и продолжать ускорять внедрение передовых технологических приложений, таких как большие модели искусственного интеллекта.
Построение инфраструктуры крупных моделей искусственного интеллекта и исследование сценариев применения становятся ключевыми моментами в планировании банковских финансовых технологий.
Юй Уцзе, заместитель генерального директора отдела информационных технологий головного офиса China Merchants Bank, рассказал, что в конце 2017 года банк создал лабораторию и начал проводить исследования в различных аспектах, таких как речь, язык, зрение и изображения, с помощью изучение традиционных технологий. «С момента запуска ChatGPT в конце 2022 года банки вложили больше ресурсов в область крупных моделей. Теперь China Merchants Bank сделал строительство инфраструктуры и сценарные приложения ключевым направлением инвестиций».
В то же время Юй Уцзе также отметил, что нынешняя большая языковая модель обладает способностью понимать, определенной способностью к порождению и способностью к предварительному логическому рассуждению, но еще не достигла стадии сложного логического рассуждения и вывода принципов. На уровне применения сценариев в финансовой отрасли Юй Уцзе считает, что разработка больших моделей прошла три этапа: на первом этапе было произведено множество цифровых продуктов, а возможности больших моделей были наложены на продукты для повышения эффективности. существующих бизнес-процессов; на втором этапе возможности искусственного интеллекта естественным образом интегрируются в создаваемые приложения, оптимизируя процесс системы обслуживания клиентов, позволяя клиентам самостоятельно получать финансовые услуги; на третьем этапе большая модель все изменит; включая базовую операционную систему, организационную модель, процесс разделения труда и т. д., что оказывает более глубокое и существенное влияние.
Судя по практике применения крупных моделей в финансовых организациях, текущая отрасль в целом находится на первом и втором этапах. Стоит отметить, что по мере того, как мы вступаем в стадию разработки крупных моделей ИИ, их применение предъявляет более высокие требования к построению инфраструктуры крупных моделей предприятия.
Лю Чжаоян, старший эксперт по алгоритмам платформы больших моделей Alibaba Cloud Bailian, сказал, что есть несколько направлений, которые можно изучить в разработке технологии больших моделей. Среди них одна для всех мультимодальных моделей, поддерживающих язык, голос и изображение. Ввод одновременно является основной тенденцией. Это набор технической парадигмы, способной обрабатывать мультимодальный ввод и вывод, такой как текст, изображения и видео, включая понимание и генерацию изображений.
Согласно последнему опубликованному «Отчету об исследованиях в области разработки технологий больших языковых моделей искусственного интеллекта (2024 г.)», будущие большие модели будут уделять больше внимания слиянию и обработке мультимодальных данных и будут иметь тенденцию улучшать возможности адаптивного обучения и передачи интерпретируемости. Алгоритмы используются для повышения прозрачности, позволяя большим языковым моделям лучше понимать и адаптироваться к сложным и изменчивым практическим средам приложений.
Однако Ван Гуанжунь, главный научный сотрудник Tuoyuan Intelligence, отметил, что большинство нынешних мультимодальных моделей основаны на технической архитектуре семилетней давности. Хотя эти модели добились определенного прогресса, у них все еще есть много недостатков, таких как высокая. затраты на обучение и выводы. Склонны к галлюцинациям, не умеют долгосрочное планирование и не способны самостоятельно выполнять сложные задачи.
Ван Гуанжунь рассказал, что в ответ на эти проблемы компания Tuoyuan Intelligence предложила инновационные идеи по изменению основы мультимодальных больших моделей с помощью новой технической архитектуры. «Эта инновационная архитектура не только значительно снижает затраты на обучение и тестирование больших моделей, но также значительно снижает порог входа малых и средних предприятий в эпоху больших моделей, способствуя тем самым выравниванию технологий».
Строительство вычислительной инфраструктуры ускоряется
Разработка и применение больших моделей во многом зависят от мощной вычислительной мощности. Лю Чжаоян сказал, что вычислительная мощность является самым дефицитным ресурсом в эту эпоху. В сегодняшнюю эпоху вычислительная мощность станет краеугольным камнем для развития каждого предприятия или развития искусственного интеллекта.
Гао Вэнь, академик Китайской инженерной академии, директор лаборатории Пэнчэн и профессор кафедры Бойя Пекинского университета, подчеркнул, что разработка таких моделей, как GPT, опирается на большие данные, большие модели и большие вычислительные мощности; является ключевым элементом национальной конкурентоспособности и создания вычислительной мощности. Энергетическая сеть имеет решающее значение и должна решать такие проблемы, как обеспечение основной вычислительной мощности, коммуникационные соединения и планирование вычислительной мощности, чтобы способствовать разработке и применению искусственного интеллекта.
На этом фоне все больше ведущих компаний продолжают наращивать инвестиции в масштабное инфраструктурное строительство.
Чэнь Си, заместитель генерального директора департамента информационных технологий головного офиса China Merchants Bank, сообщил, что в настоящее время банк также ускоряет создание облачной платформы искусственного интеллекта, чтобы предоставить базовые возможности и модельную платформу обслуживания, необходимую для бизнес-приложений искусственного интеллекта, уделяя особое внимание обучающий кластер и кластер вывода. Построение вычислительной инфраструктуры.
Чэнь Си сказал, что упомянутые выше «три года в облако» — это комплексное облако. С появлением крупных моделей доля интеллектуальных вычислений будет становиться все больше и больше, и это не только модернизация инфраструктуры, но и предполагающая. Изменение парадигмы на более высоком уровне.
Лю Чжаоян отметил, что после того, как GPT начнет резервировать большие модели Transformer в 2020 или 2021 году, количество и масштаб крупных моделей, а также спрос на вычислительную мощность и данные больших моделей, стоящих за ними, будут демонстрировать значительный экспоненциальный рост. тенденция.
В условиях такой тенденции большие модели также создают большие проблемы с поддержкой вычислительной мощности.
Чжоу Вэй, главный архитектор Kunlun Core Financial, отметил, что темпы роста требований к вычислительной мощности для больших моделей намного превышают темпы роста самого аппаратного обеспечения, что одновременно является так называемым законом Мура; контекст конкуренции между Китаем и Соединенными Штатами, особенно отечественные фишки, по-прежнему. Будут проблемы с застреванием шеи. «Говоря в целом, глобальные вычислительные мощности не удовлетворены текущим спросом на программное обеспечение».
Кроме того, Чжоу Вэй также заявил, что то, как оценить, сможет ли определенная вычислительная мощность удовлетворить спрос, зависит не только от самой вычислительной мощности, но и от комплексных показателей. По мнению Чжоу Вэя, сейчас общепризнано, что вычислительная мощность — это не простой показатель, такой как простой расчет чисел с плавающей запятой, основной частоты или количества ядер. Это комплексное значение различных аппаратных возможностей в области вычислений, хранения и связи.
Чжоу Вэй подчеркнул, что для удовлетворения потребностей предварительного обучения крупных моделей или точной настройки вычислительной мощности необходимо использовать различные вычислительные мощности в качестве гетерогенного смешанного пула вычислительных ресурсов, а также задач обучения, задач вывода и агента Rag.
Увеличивая инвестиции в строительство вычислительной инфраструктуры, некоторые финансовые учреждения также начали обращать внимание на улучшение инновационных возможностей талантливых специалистов в области финансовых технологий, чтобы дополнительно помочь в создании крупных моделей искусственного интеллекта и изучении практики их применения.
Чжоу Тяньхун сказал, что, глядя в будущее, после эпохи пара, электричества и информации, человеческое общество вот-вот вступит в интеллектуальную эпоху; только расцвет технологических приложений может способствовать общему развитию «ИИ + финансы».
Гао Сюлей, директор отдела развития цифровых финансов головного офиса China Merchants Bank, также сообщил, что банк запустил программу обучения цифровым финансам Пуцзян, чтобы увеличить частоту и плотность обменов и стремиться к созданию более инновационных направлений. По мнению Гао Сюлея, инновации не возникают изолированно, а расцветают на пересечении идей, опыта и культуры в подходящей среде. «В волне цифровых финансов каждый является свидетелем, участником и творцом. Я надеюсь, что все финансовые учреждения смогут совместно изучать законы развития цифровых финансов, пробовать инновационные модели и методы, а также совместно способствовать разработке и применению передовых технологий. цифровые финансовые технологии».