국내 최초 AAA 게임 대작 '흑신화: 오공'이 전 세계적으로 인기를 끌면서, 물리적 세계와 그 뒤의 가상 세계의 원활한 연결을 구현하는 우주 컴퓨팅 파워 시장은 빠르게 수도권의 새로운 인기 시장으로 자리 잡았습니다. 시장. 대형 모델의 물결 속에서 컴퓨팅 성능에 대한 엄청난 수요가 나타났습니다.
동시에 컴퓨팅 성능 향상을 지원하기 위한 인프라 구축도 업계의 관심을 끌었습니다. 2024년부터 AI 대형 모델이 적용 첫 해에 접어들었습니다. 점점 더 많은 상업 은행이 대형 모델의 인프라 구축에 대한 투자를 지속적으로 늘리고 있습니다. 다중 모드 모델 아키텍처 기능은 금융 기관 레이아웃의 핵심 방향이 되고 있습니다.
다중 모드 대형 모델의 추세가 부각됩니다.
대형 모델 역량이 지속적으로 향상되면서 2024년부터 은행 등 금융기관에서는 AI 대형 모델의 시나리오 적용과 생태학적 구축을 늘려왔다.
최근 다수의 상장은행이 연차보고서를 통해 AI 대형 모델 플랫폼 구축 진행 상황을 공개했다. 초상은행의 반기 보고서에 따르면 은행은 대규모 언어 모델의 체계적 구축을 강화하고 인프라, 추론 및 훈련 플랫폼, 알고리즘 및 모델, 애플리케이션 개발 프레임워크 및 시나리오 애플리케이션과 같은 분야에서 포괄적인 노력을 기울였습니다. 내부 대형 모델 체험 플랫폼 구축을 지속적으로 개선하고, 100개 이상의 대형 모델 생태 체인 기업과의 심층 커뮤니케이션을 강화하고, 대형 모델의 내부 및 외부 생태 구축을 촉진하며, AI 등 첨단 기술 적용을 가속화합니다. 회사의 대형 모델.
중국 건설은행은 반기 보고서에서 계속해서 대규모 금융 모델의 구축 및 적용을 촉진하고 기업 금융, 개인 금융, 자본 자산 등 6개 주요 부문에서 79개 은행 내 비즈니스 시나리오를 완전히 강화할 것임을 분명히 했습니다. 관리, 위험 관리, 기술 채널 및 종합 관리.
평안은행 반기 보고서는 상반기에 대형 모델 개방형 플랫폼을 독자적으로 개발하고 컴퓨팅 파워 플랫폼, 대형 모델 기반, 대형 모델 개발 및 운영 통합 등 기본 역량 구축을 강화했다고 지적했다. Ops), 에이전트, 애플리케이션 개발 플랫폼입니다.
2024년 CMB 푸장 디지털 금융 생태학 컨퍼런스에서 정보기술부 총책임자이자 중국초상은행 최고정보책임자 지명자인 Zhou Tianhong은 대형 모델이 인류 사회에 영향을 미치는 가장 큰 요인이 될 것이며 사람들의 경제, 사회를 근본적으로 변화시킬 것이라고 말했습니다. 은행은 또한 대형 모델 시나리오의 적용을 적극적으로 탐색하고 AI 대형 모델과 같은 첨단 기술 적용을 계속 가속화할 것입니다.
AI 대형 모델 인프라 구축과 시나리오 적용 탐색은 은행 금융 기술 레이아웃의 핵심 초점이 되고 있습니다.
초상은행 본점 정보기술부 부국장 유 우지에(Yu Wujie)는 은행이 2017년 말 연구실을 설립하고 음성, 언어, 시각, 영상 등 다양한 측면의 연구를 시작했다고 밝혔다. 전통 기술을 연구합니다. "2022년 말 ChatGPT 출시 이후 은행들은 대형 모델 분야에 더 많은 자원을 투자해 왔습니다. 이제 초상은행은 인프라 구축과 시나리오 적용을 핵심 투자 방향으로 삼았습니다."
동시에 Yu Wujie는 현재의 대형 언어 모델이 이해 능력, 특정 생성 능력 및 예비 논리적 추론 능력을 갖추고 있지만 아직 복잡한 논리적 추론 및 원리 도출 단계에 도달하지 못했다고 지적했습니다. 금융 산업의 시나리오 적용 수준에서 Yu Wujie는 대형 모델의 개발이 세 단계를 거쳤다고 믿습니다. 첫 번째 단계에서는 많은 디지털 제품이 생산되었으며 효율성을 향상시키기 위해 대형 모델 기능이 제품에 중첩되었습니다. 두 번째 단계에서는 AI의 기능이 생성된 애플리케이션에 자연스럽게 통합되어 고객 서비스 시스템 프로세스를 최적화하고 세 번째 단계에서는 고객이 스스로 금융 서비스를 받을 수 있도록 하며, 대규모 모델은 모든 것을 재구성합니다. 기본 운영 체제, 조직 모델, 프로세스 분업 등을 포함하여 더욱 심오하고 필수적인 영향을 미칩니다.
금융기관의 대형 모델 적용 사례로 볼 때 현재 업계는 대체로 1단계와 2단계에 머물러 있다. AI 대형 모델의 개발 단계에 진입함에 따라 대형 모델의 적용으로 인해 기업 대형 모델의 인프라 구축에 대한 요구 사항이 더 높아졌다는 점은 주목할 가치가 있습니다.
Alibaba Cloud Bailian 대형 모델 플랫폼의 수석 알고리즘 전문가인 Liu Zhaoyang은 대형 모델 기술 개발에서 탐색할 수 있는 여러 방향이 있다고 말했습니다. 그 중 하나는 언어, 음성 및 이미지를 지원하는 모든 다중 모드 모델을 위한 것입니다. 이미지 이해 및 생성을 포함하여 텍스트, 이미지, 비디오 등의 다중 모드 입력 및 출력을 처리할 수 있는 기술 패러다임의 집합입니다.
최근 발표된 '인공지능 대형 언어 모델 기술 개발 연구 보고서(2024)'에 따르면, 미래 대형 모델은 다중 모드 데이터의 융합 및 처리에 더 많은 관심을 기울이고 적응형 및 전이 학습 기능을 향상시키는 경향이 있을 것입니다. 알고리즘은 투명성을 향상시키는 데 사용되므로 대규모 언어 모델이 복잡하고 변경 가능한 실제 응용 프로그램 환경을 더 잘 이해하고 적응할 수 있습니다.
그러나 Tuoyuan Intelligence의 수석 과학자인 Wang Guangrun은 현재 다중 모드 모델의 대부분이 7년 전의 기술 아키텍처를 기반으로 한다고 지적했습니다. 이러한 모델은 어느 정도 진전을 이루었지만 여전히 높은 수준의 단점을 가지고 있습니다. 훈련 및 추론 비용, 환각에 취약하고 장기 계획이 좋지 않으며 복잡한 작업을 독립적으로 완료할 수 없습니다.
Wang Guangrun은 이러한 문제에 대응하여 Tuoyuan Intelligence가 새로운 기술 아키텍처를 통해 다중 모드 대형 모델의 기반을 재구성하는 혁신적인 아이디어를 제안했다고 밝혔습니다. “이 혁신적인 아키텍처는 대형 모델의 교육 및 테스트 비용을 크게 줄일 뿐만 아니라 중소기업이 대형 모델 시대로 진입하는 문턱을 크게 낮추어 기술 평등화를 촉진합니다.”
컴퓨팅 인프라 구축 속도 빨라져
대형 모델의 개발 및 적용은 강력한 컴퓨팅 성능 지원에 크게 의존합니다. Liu Zhaoyang은 컴퓨팅 파워가 이 시대에 가장 부족한 자원이라고 말했습니다. 오늘날 컴퓨팅 파워는 기본적으로 모든 기업의 발전이나 인공 지능 개발의 가장 큰 초석이 될 것입니다.
중국 공학원 학자이자 Pengcheng 연구소 소장이자 Peking University Boya 석좌 교수인 Gao Wen은 GPT와 같은 모델의 개발은 빅 데이터, 빅 모델 및 대규모 컴퓨팅 성능에 달려 있다고 강조했습니다. 국가 경쟁력의 핵심 요소이자 컴퓨팅 파워 구축 전력 네트워크는 AI의 개발과 적용을 촉진하기 위해 핵심 컴퓨팅 전원 공급, 통신 연결, 컴퓨팅 파워 스케줄링 등의 과제를 해결하는 데 매우 중요하며 필요합니다.
이러한 배경에서 점점 더 많은 선두 기업들이 대규모 인프라 건설에 대한 투자를 계속 늘리고 있습니다.
중국 초상은행 본점 정보기술부 차장 Chen Xi는 또한 은행이 현재 AI 비즈니스 애플리케이션에 필요한 기본 기능과 모델 서비스 플랫폼을 제공하기 위해 AI 클라우드 플랫폼 구축에도 박차를 가하고 있다고 밝혔습니다. 훈련 클러스터와 추론 클러스터 구축.
Chen Xi는 앞서 언급한 "클라우드 3년"은 포괄적인 클라우드라고 말했습니다. 대형 모델의 출현으로 지능형 컴퓨팅의 비율은 점점 더 커질 것이며 이는 인프라 업그레이드뿐만 아니라 포함됩니다. 더 높은 수준의 발전.
Liu Zhaoyang은 GPT가 2020년 또는 2021년에 Transformer 대형 모델을 예약하기 시작한 후 대형 모델의 수와 규모뿐만 아니라 그 뒤를 잇는 대형 모델의 컴퓨팅 성능과 데이터에 대한 수요도 기하급수적으로 크게 증가할 것이라고 지적했습니다. 경향.
이러한 추세에 따라 대형 모델은 컴퓨팅 성능 지원에 더 큰 과제를 안겨줍니다.
Kunlun Core Financial의 수석 설계자인 Zhou Wei는 대형 모델의 컴퓨팅 성능 요구 사항 증가율이 소위 무어의 법칙인 하드웨어 자체의 증가율보다 훨씬 크다고 지적했습니다. 중국과 미국의 경쟁 상황, 특히 국내 칩은 여전히 목이 막히는 문제가 있을 것이다. "그러므로 일반적으로 말하면 글로벌 컴퓨팅 전원 공급 장치는 현재 소프트웨어 수요를 만족하지 못합니다."
또한 Zhou Wei는 특정 컴퓨팅 능력이 수요를 충족할 수 있는지 여부를 평가하는 방법은 컴퓨팅 능력 자체뿐만 아니라 포괄적인 지표에 따라 달라진다고 말했습니다. Zhou Wei의 견해에 따르면 컴퓨팅 성능은 단순한 부동 소수점 수나 주요 주파수 또는 코어 수 계산과 같은 단순한 지표가 아니라 컴퓨팅, 저장 및 통신 분야의 다양한 하드웨어 기능에 대한 포괄적인 가치라는 것이 일반적으로 받아들여지고 있습니다.
Zhou Wei는 대규모 모델 사전 훈련 또는 컴퓨팅 능력의 미세 조정 요구를 충족하기 위해 서로 다른 컴퓨팅 능력을 이기종 혼합 컴퓨팅 리소스 풀과 훈련 작업, 추론 작업 및 Agent, Rag로 사용해야 한다고 강조했습니다.
컴퓨팅 파워 인프라 구축에 대한 투자를 강화하는 동시에 일부 금융 기관은 AI 대형 모델 구축 및 응용 사례 탐색을 더욱 지원하기 위해 금융 기술 인재의 혁신 역량 향상에 관심을 기울이기 시작했습니다.
Zhou Tianhong은 미래를 내다보며 증기 시대, 전기 시대, 정보 시대에 이어 인류 사회가 곧 지능 시대로 진입할 것이라고 말했습니다. 기술 응용의 번영만이 'AI + 금융'의 전반적인 발전을 촉진할 수 있습니다.
중국초상은행 본사 디지털 금융 개발실 이사 Gao Xulei는 또한 은행이 교환 빈도와 밀도를 높이고 보다 혁신적인 방향을 창출하기 위해 노력하기 위해 Pujiang 디지털 금융 학습 프로그램을 시작했다고 밝혔습니다. Gao Xulei의 관점에서 혁신은 단독으로 발생하는 것이 아니라 적절한 환경에서 아이디어, 경험 및 문화가 교차할 때 꽃을 피웁니다. “디지털 금융의 물결 속에서 모두가 증인이자 참여자, 창조자입니다. 모든 금융기관이 디지털 금융의 발전 법칙을 공동으로 연구하고 혁신적인 모델과 방법을 시도하며 최첨단 기술의 개발과 적용을 공동으로 추진할 수 있기를 바랍니다. 디지털 금융 기술."