Ketika mahakarya game AAA domestik pertama "Black Myth: Wukong" menjadi populer di seluruh dunia, pasar kekuatan komputasi luar angkasa yang menyadari hubungan mulus antara dunia fisik dan dunia virtual di baliknya dengan cepat menjadi favorit baru di ibu kota. pasar. Di bawah gelombang model besar, tuntutan besar akan daya komputasi telah muncul.
Pada saat yang sama, pembangunan infrastruktur untuk mendukung peningkatan daya komputasi juga menarik perhatian industri. Sejak tahun 2024, model besar AI telah memasuki tahun pertama penerapannya. Semakin banyak bank komersial yang terus meningkatkan investasi dalam pembangunan infrastruktur model besar. Kemampuan arsitektur model multimodal menjadi arah utama tata letak lembaga keuangan.
Tren model multimodal besar menjadi sorotan
Dengan peningkatan berkelanjutan pada kemampuan model besar, sejak tahun 2024, bank dan lembaga keuangan lainnya telah meningkatkan penerapan skenario dan konstruksi ekologis model besar AI.
Baru-baru ini, sejumlah bank yang terdaftar telah mengungkapkan kemajuan pembangunan platform model besar AI dalam laporan tahunan mereka. Laporan tengah tahunan China Merchants Bank menunjukkan bahwa bank tersebut telah memperkuat konstruksi sistematis model bahasa besar dan melakukan upaya komprehensif di berbagai bidang seperti infrastruktur, platform penalaran dan pelatihan, algoritme dan model, kerangka pengembangan aplikasi, dan penerapan skenario. Terus meningkatkan pembangunan platform pengalaman model besar internal, memperkuat komunikasi mendalam dengan lebih dari 100 perusahaan rantai ekologi model besar, mempromosikan konstruksi ekologi internal dan eksternal model besar, dan mempercepat penerapan teknologi mutakhir seperti AI model besar di perusahaan.
China Construction Bank memperjelas dalam laporan tengah tahunannya bahwa mereka akan terus mendorong pembangunan dan penerapan model keuangan skala besar dan sepenuhnya memberdayakan 79 skenario bisnis bank di enam sektor utama: keuangan perusahaan, keuangan pribadi, aset modal. manajemen, manajemen risiko, saluran teknologi, dan manajemen komprehensif.
Laporan tengah tahunan Ping An Bank menunjukkan bahwa pada paruh pertama tahun ini, mereka secara mandiri mengembangkan platform terbuka model besar dan memperkuat pembangunan kemampuan dasar seperti platform daya komputasi, basis model besar, pengembangan model besar, dan integrasi operasi ( Ops), agen, dan platform pengembangan aplikasi.
Pada Konferensi Ekologi Keuangan Digital CMB Pujiang 2024, Zhou Tianhong, manajer umum Departemen Teknologi Informasi dan kepala pejabat informasi yang ditunjuk di China Merchants Bank, mengatakan bahwa model besar akan menjadi faktor terbesar yang mempengaruhi masyarakat manusia dan sangat mengubah perekonomian masyarakat, masyarakat. dan metode kehidupan di masa depan; bank juga akan secara aktif menjajaki penerapan skenario model besar dan terus mempercepat penerapan teknologi mutakhir seperti model besar AI.
Pembangunan infrastruktur model besar AI dan eksplorasi penerapan skenario menjadi fokus utama tata letak teknologi keuangan bank.
Yu Wujie, Deputy General Manager Departemen Teknologi Informasi Kantor Pusat China Merchants Bank, mengungkapkan bahwa bank tersebut mendirikan laboratorium pada akhir tahun 2017 dan mulai melakukan penelitian di berbagai aspek seperti ucapan, bahasa, penglihatan, dan gambar melalui studi tentang teknologi tradisional. “Sejak peluncuran ChatGPT pada akhir tahun 2022, bank telah menginvestasikan lebih banyak sumber daya di bidang model besar. Kini China Merchants Bank telah menjadikan pembangunan infrastruktur dan penerapan skenario sebagai arah investasi utama.”
Pada saat yang sama, Yu Wujie juga menunjukkan bahwa model bahasa besar saat ini memiliki kemampuan pemahaman, kemampuan generasi tertentu dan kemampuan penalaran logis awal, tetapi belum mencapai tahap penalaran logis yang kompleks dan derivasi prinsip. Pada tingkat penerapan skenario di industri keuangan, Yu Wujie percaya bahwa pengembangan model besar telah melalui tiga tahap: tahap pertama, banyak produk digital diproduksi, dan kemampuan model besar ditumpangkan pada produk untuk meningkatkan efisiensi. proses bisnis yang ada; Pada tahap kedua, kemampuan AI secara alami diintegrasikan ke dalam aplikasi yang dihasilkan, mengoptimalkan proses sistem layanan pelanggan, memungkinkan pelanggan memperoleh layanan keuangan sendiri; pada tahap ketiga, model besar akan membentuk kembali segalanya, termasuk sistem operasi yang mendasarinya, model organisasi, proses pembagian kerja, dll., yang membawa dampak yang lebih mendalam dan penting.
Dilihat dari praktik penerapan model besar di lembaga keuangan, industri saat ini umumnya berada pada tahap pertama dan kedua. Perlu dicatat bahwa saat kita memasuki tahap pengembangan model besar AI, penerapan model besar telah mengajukan persyaratan yang lebih tinggi untuk pembangunan infrastruktur model besar perusahaan.
Liu Zhaoyang, pakar algoritma senior di Alibaba Cloud Bailian Large Model Platform, mengatakan ada beberapa arah yang bisa dijajaki dalam pengembangan teknologi model besar. Diantaranya, Satu untuk semua model multi-modal yang mendukung bahasa, suara, dan gambar input pada saat yang sama merupakan tren utama. Ini adalah seperangkat paradigma teknis yang mampu memproses input dan output multi-modal seperti teks, gambar, dan video, termasuk pemahaman dan pembuatan gambar.
Menurut "Laporan Penelitian Pengembangan Teknologi Model Bahasa Besar Kecerdasan Buatan (2024)" terbaru yang dirilis, model besar di masa depan akan lebih memperhatikan penggabungan dan pemrosesan data multi-modal, dan akan cenderung meningkatkan kemampuan pembelajaran adaptif dan transfer algoritma digunakan untuk meningkatkan transparansi, memungkinkan model bahasa besar untuk lebih memahami dan beradaptasi dengan lingkungan aplikasi praktis yang kompleks dan dapat diubah.
Namun, Wang Guangrun, kepala ilmuwan Tuoyuan Intelligence, menunjukkan bahwa sebagian besar model multi-modal saat ini didasarkan pada arsitektur teknis 7 tahun yang lalu. Meskipun model ini telah mengalami kemajuan tertentu, model tersebut masih memiliki banyak kekurangan, seperti tingginya biaya pelatihan dan inferensi, Rentan terhadap halusinasi, tidak pandai dalam perencanaan jangka panjang, dan tidak mampu menyelesaikan tugas kompleks secara mandiri.
Wang Guangrun mengungkapkan bahwa sebagai respons terhadap permasalahan ini, Tuoyuan Intelligence mengusulkan ide-ide inovatif untuk membentuk kembali fondasi model besar multimodal melalui arsitektur teknis baru. “Arsitektur inovatif ini tidak hanya secara signifikan mengurangi biaya pelatihan dan pengujian model-model besar, namun juga secara signifikan menurunkan ambang batas bagi usaha kecil dan menengah untuk memasuki era model-model besar, sehingga mendorong pemerataan teknologi.”
Pembangunan infrastruktur komputasi semakin cepat
Pengembangan dan penerapan model besar sangat bergantung pada dukungan daya komputasi yang kuat. Liu Zhaoyang mengatakan bahwa daya komputasi adalah sumber daya yang paling langka di era ini. Di era sekarang ini, daya komputasi pada dasarnya akan menjadi landasan terbesar bagi pengembangan setiap perusahaan atau pengembangan kecerdasan buatan.
Gao Wen, akademisi Akademi Teknik Tiongkok, direktur Laboratorium Pengcheng, dan Ketua Profesor Boya di Universitas Peking, menekankan bahwa pengembangan model seperti GPT bergantung pada data besar, model besar, dan daya komputasi yang besar; adalah elemen inti daya saing nasional, dan pembangunan daya komputasi Jaringan listrik sangat penting dan perlu memecahkan tantangan seperti pasokan daya komputasi inti, koneksi komunikasi, dan penjadwalan daya komputasi untuk mendorong pengembangan dan penerapan AI.
Dengan latar belakang ini, semakin banyak perusahaan terkemuka yang terus meningkatkan investasi dalam pembangunan infrastruktur skala besar.
Chen Xi, wakil manajer umum Kantor Pusat Departemen Teknologi Informasi China Merchants Bank, mengungkapkan bahwa bank tersebut juga sedang mempercepat pembangunan platform cloud AI untuk menyediakan kemampuan dasar dan platform layanan model yang diperlukan untuk aplikasi bisnis AI, dengan fokus pada cluster pelatihan dan cluster inferensi.
Chen Xi mengatakan bahwa "tiga tahun menuju cloud" yang disebutkan sebelumnya adalah cloud yang komprehensif. Dengan munculnya model-model besar, proporsi komputasi cerdas akan menjadi semakin besar, dan ini tidak hanya mencakup peningkatan infrastruktur, tetapi juga melibatkan peningkatan infrastruktur. perkembangan tingkat yang lebih tinggi.
Liu Zhaoyang menunjukkan bahwa setelah GPT mulai memesan model besar Transformer pada tahun 2020 atau 2021, baik jumlah dan skala model besar, serta permintaan daya komputasi dan data dari model besar di belakangnya, akan menunjukkan pertumbuhan eksponensial yang signifikan. kecenderungan.
Dalam tren ini, model berukuran besar juga membawa tantangan yang lebih besar terhadap dukungan daya komputasi.
Zhou Wei, kepala arsitek Kunlun Core Financial, menunjukkan bahwa tingkat pertumbuhan kebutuhan daya komputasi untuk model besar jauh lebih besar daripada tingkat pertumbuhan perangkat keras itu sendiri, yang pada saat yang sama disebut Hukum Moore; Dalam konteks persaingan antara China dan Amerika Serikat, khususnya chip dalam negeri, masih akan ada kendala yang dihadapi. “Jadi secara umum, pasokan daya komputasi global tidak memenuhi permintaan perangkat lunak saat ini.”
Selain itu, Zhou Wei juga mengatakan bahwa cara mengevaluasi apakah suatu daya komputasi tertentu dapat memenuhi permintaan tidak hanya bergantung pada daya komputasi itu sendiri, tetapi juga pada indikator yang komprehensif. Dalam pandangan Zhou Wei, sekarang diterima secara umum bahwa daya komputasi bukanlah indikator sederhana seperti penghitungan sederhana angka floating point atau frekuensi utama atau nomor inti. Ini adalah nilai komprehensif dari berbagai kemampuan perangkat keras dalam komputasi, penyimpanan, dan komunikasi.
Zhou Wei menekankan bahwa untuk memenuhi kebutuhan pra-pelatihan model besar atau penyesuaian daya komputasi, daya komputasi yang berbeda harus digunakan sebagai kumpulan sumber daya komputasi campuran yang heterogen, dan tugas pelatihan, tugas inferensi, dan Agen, Rag.
Sambil memperkuat investasi dalam pembangunan infrastruktur daya komputasi, beberapa lembaga keuangan juga mulai memperhatikan peningkatan kemampuan inovasi talenta teknologi keuangan untuk lebih membantu pembangunan model besar AI dan eksplorasi praktik aplikasi.
Zhou Tianhong mengatakan bahwa melihat ke masa depan, setelah era uap, era listrik, dan era informasi, masyarakat manusia akan memasuki era cerdas; hanya berkembangnya aplikasi teknologi yang dapat mendorong perkembangan "AI + finance" secara keseluruhan.
Gao Xulei, direktur Kantor Pengembangan Keuangan Digital Kantor Pusat China Merchants Bank, juga mengungkapkan bahwa bank meluncurkan Program Pembelajaran Keuangan Digital Pujiang untuk meningkatkan frekuensi dan kepadatan pertukaran serta berupaya menciptakan arah yang lebih inovatif. Dalam pandangan Gao Xulei, inovasi tidak terjadi secara terpisah, namun berkembang di persimpangan antara ide, pengalaman, dan budaya dalam lingkungan yang sesuai. “Dalam gelombang keuangan digital, setiap orang adalah saksi, partisipan, dan pencipta. Saya berharap semua lembaga keuangan dapat bersama-sama mempelajari hukum perkembangan keuangan digital, mencoba model dan metode inovatif, dan bersama-sama mendorong pengembangan dan penerapan teknologi mutakhir. teknologi keuangan digital."