เนื่องจากผลงานชิ้นเอกของเกม AAA ในประเทศเกมแรก "Black Myth: Wukong" ได้รับความนิยมไปทั่วโลก ตลาดพลังการประมวลผลอวกาศที่ตระหนักถึงการเชื่อมต่อที่ไร้รอยต่อระหว่างโลกทางกายภาพและโลกเสมือนจริงที่อยู่เบื้องหลังได้กลายมาเป็นที่ชื่นชอบครั้งใหม่ของเมืองหลวงอย่างรวดเร็ว ตลาด. ภายใต้กระแสของโมเดลขนาดใหญ่ ความต้องการพลังประมวลผลมหาศาลได้เกิดขึ้น
ในขณะเดียวกัน การก่อสร้างโครงสร้างพื้นฐานเพื่อรองรับการปรับปรุงพลังการประมวลผลก็ดึงดูดความสนใจของอุตสาหกรรมเช่นกัน ตั้งแต่ปี 2024 เป็นต้นมา โมเดลขนาดใหญ่ของ AI ได้เข้าสู่การใช้งานในปีแรก ธนาคารพาณิชย์จำนวนมากขึ้นเรื่อยๆ ยังคงเพิ่มการลงทุนในการก่อสร้างโครงสร้างพื้นฐานของโมเดลขนาดใหญ่อย่างต่อเนื่อง
เน้นแนวโน้มของโมเดลขนาดใหญ่หลายรูปแบบ
ด้วยการปรับปรุงความสามารถของโมเดลขนาดใหญ่อย่างต่อเนื่อง ตั้งแต่ปี 2024 ธนาคารและสถาบันการเงินอื่นๆ ได้เพิ่มการประยุกต์ใช้สถานการณ์และการสร้างโมเดล AI ขนาดใหญ่ในระบบนิเวศ
ล่าสุด ธนาคารจดทะเบียนหลายแห่งได้เปิดเผยความคืบหน้าของการสร้างแพลตฟอร์มโมเดลขนาดใหญ่ของ AI ในรายงานประจำปีของพวกเขา รายงานรายครึ่งปีของ China Merchants Bank แสดงให้เห็นว่าธนาคารได้เสริมความแข็งแกร่งให้กับการสร้างโมเดลภาษาขนาดใหญ่อย่างเป็นระบบ และพยายามอย่างครอบคลุมในด้านต่างๆ เช่น โครงสร้างพื้นฐาน แพลตฟอร์มการให้เหตุผลและการฝึกอบรม อัลกอริธึมและโมเดล กรอบการพัฒนาแอปพลิเคชัน และแอปพลิเคชันสถานการณ์ ปรับปรุงการสร้างแพลตฟอร์มประสบการณ์แบบจำลองขนาดใหญ่ภายในอย่างต่อเนื่อง เสริมสร้างการสื่อสารเชิงลึกกับบริษัทห่วงโซ่ระบบนิเวศแบบจำลองขนาดใหญ่มากกว่า 100 แห่ง ส่งเสริมการก่อสร้างแบบจำลองขนาดใหญ่ทั้งภายในและภายนอกของแบบจำลองขนาดใหญ่ และเร่งการประยุกต์ใช้เทคโนโลยีล้ำสมัย เช่น AI รุ่นใหญ่ในบริษัท
China Construction Bank ระบุอย่างชัดเจนในรายงานรายครึ่งปีว่าจะยังคงส่งเสริมการก่อสร้างและการประยุกต์ใช้โมเดลทางการเงินขนาดใหญ่ และเสริมศักยภาพอย่างเต็มที่ให้กับสถานการณ์ธุรกิจในธนาคาร 79 รูปแบบใน 6 ภาคส่วนหลัก ได้แก่ การเงินองค์กร การเงินส่วนบุคคล สินทรัพย์ด้านทุน การจัดการ การบริหารความเสี่ยง ช่องทางเทคโนโลยี และการบริหารจัดการแบบครบวงจร
รายงานรายครึ่งปีของธนาคาร Ping An ชี้ให้เห็นว่าในช่วงครึ่งแรกของปี ธนาคารได้พัฒนาแพลตฟอร์มแบบเปิดขนาดใหญ่อย่างเป็นอิสระ และเสริมความแข็งแกร่งให้กับการสร้างความสามารถขั้นพื้นฐาน เช่น แพลตฟอร์มพลังการประมวลผล ฐานโมเดลขนาดใหญ่ การพัฒนาโมเดลขนาดใหญ่ และการบูรณาการการดำเนินงาน ( Ops) ตัวแทน และแพลตฟอร์มการพัฒนาแอปพลิเคชัน
ในการประชุมระบบนิเวศทางการเงินดิจิทัล Pujiang ประจำปี 2024 โจว เทียนหง ผู้จัดการทั่วไปแผนกเทคโนโลยีสารสนเทศและประธานเจ้าหน้าที่สารสนเทศที่ได้รับมอบหมายจาก China Merchants Bank กล่าวว่าโมเดลขนาดใหญ่จะกลายเป็นปัจจัยที่ใหญ่ที่สุดที่ส่งผลกระทบต่อสังคมมนุษย์ และเปลี่ยนแปลงเศรษฐกิจและสังคมของผู้คนอย่างลึกซึ้ง และวิถีชีวิตในอนาคต นอกจากนี้ ธนาคารจะสำรวจการประยุกต์ใช้สถานการณ์จำลองขนาดใหญ่และเร่งดำเนินการใช้งานเทคโนโลยีล้ำสมัย เช่น โมเดลขนาดใหญ่ของ AI ต่อไป
การสร้างโครงสร้างพื้นฐานแบบจำลองขนาดใหญ่ของ AI และการสำรวจแอปพลิเคชันสถานการณ์กำลังกลายเป็นจุดสนใจหลักของรูปแบบเทคโนโลยีทางการเงินของธนาคาร
Yu Wujie รองผู้จัดการทั่วไปแผนกเทคโนโลยีสารสนเทศของ China Merchants Bank สำนักงานใหญ่ เปิดเผยว่า ธนาคารได้จัดตั้งห้องปฏิบัติการเมื่อปลายปี 2560 และเริ่มดำเนินการวิจัยในด้านต่างๆ เช่น คำพูด ภาษา การมองเห็น และภาพ ผ่านทาง ศึกษาเทคโนโลยีดั้งเดิม "นับตั้งแต่เปิดตัว ChatGPT เมื่อปลายปี 2565 ธนาคารต่างๆ ได้ลงทุนทรัพยากรมากขึ้นในด้านโมเดลขนาดใหญ่ ในปัจจุบัน China Merchants Bank ได้กำหนดให้การก่อสร้างโครงสร้างพื้นฐานและการประยุกต์ใช้สถานการณ์จำลองเป็นทิศทางการลงทุนที่สำคัญ"
ในเวลาเดียวกัน หยู หวู่เจี๋ยยังชี้ให้เห็นว่าแบบจำลองภาษาขนาดใหญ่ในปัจจุบันมีความสามารถในการเข้าใจ ความสามารถในการสร้างบางอย่าง และความสามารถในการให้เหตุผลเชิงตรรกะเบื้องต้น แต่ยังไม่ถึงขั้นของการให้เหตุผลเชิงตรรกะที่ซับซ้อนและการสืบทอดหลักการ ในระดับการประยุกต์ใช้สถานการณ์ในอุตสาหกรรมการเงิน Yu Wujie เชื่อว่าการพัฒนาแบบจำลองขนาดใหญ่ได้ผ่านสามขั้นตอน: ในขั้นตอนแรก มีการผลิตผลิตภัณฑ์ดิจิทัลจำนวนมาก และความสามารถของโมเดลขนาดใหญ่ถูกซ้อนทับบนผลิตภัณฑ์เพื่อปรับปรุงประสิทธิภาพ ของกระบวนการทางธุรกิจที่มีอยู่ ในขั้นตอนที่สอง ความสามารถของ AI จะถูกรวมเข้ากับแอปพลิเคชันที่สร้างขึ้นอย่างเป็นธรรมชาติ เพิ่มประสิทธิภาพกระบวนการของระบบการบริการลูกค้า ทำให้ลูกค้าสามารถรับบริการทางการเงินได้ด้วยตัวเอง ในขั้นตอนที่สาม โมเดลขนาดใหญ่จะปรับโฉมทุกอย่าง รวมถึงระบบปฏิบัติการพื้นฐาน โมเดลองค์กร การแบ่งกระบวนการของแรงงาน ฯลฯ นำมาซึ่งผลกระทบที่ลึกซึ้งและสำคัญยิ่งขึ้น
เมื่อพิจารณาจากแนวปฏิบัติของการประยุกต์ใช้โมเดลขนาดใหญ่ในสถาบันการเงิน โดยทั่วไปอุตสาหกรรมในปัจจุบันจะอยู่ในระยะที่หนึ่งและสอง เป็นที่น่าสังเกตว่าเมื่อเราเข้าสู่ขั้นตอนการพัฒนาโมเดลขนาดใหญ่ของ AI การใช้งานโมเดลขนาดใหญ่ได้ก่อให้เกิดข้อกำหนดที่สูงขึ้นสำหรับการสร้างโครงสร้างพื้นฐานของโมเดลขนาดใหญ่ขององค์กร
Liu Zhaoyang ผู้เชี่ยวชาญด้านอัลกอริทึมอาวุโสของ Alibaba Cloud Bailian Large Model Platform กล่าวว่า มีหลายทิศทางที่สามารถสำรวจได้ในการพัฒนาเทคโนโลยีโมเดลขนาดใหญ่ ในนั้น แนวทางหนึ่งสำหรับโมเดลหลายรูปแบบทั้งหมดที่รองรับภาษา เสียง และรูปภาพ การป้อนข้อมูลในเวลาเดียวกันถือเป็นแนวโน้มสำคัญ นี่คือชุดของกระบวนทัศน์ทางเทคนิคที่สามารถประมวลผลอินพุตและเอาท์พุตหลายรูปแบบ เช่น ข้อความ รูปภาพ และวิดีโอ รวมถึงการทำความเข้าใจและสร้างภาพ
ตามรายงานการวิจัยการพัฒนาเทคโนโลยีแบบจำลองภาษาปัญญาประดิษฐ์ขนาดใหญ่ (2024) ล่าสุดที่เผยแพร่ แบบจำลองขนาดใหญ่ในอนาคตจะให้ความสำคัญกับการผสมผสานและการประมวลผลข้อมูลหลายรูปแบบมากขึ้น และมีแนวโน้มที่จะปรับปรุงความสามารถในการปรับตัวและถ่ายโอนการเรียนรู้ อัลกอริธึมถูกนำมาใช้เพื่อปรับปรุงความโปร่งใส ช่วยให้โมเดลภาษาขนาดใหญ่เข้าใจได้ดีขึ้นและปรับให้เข้ากับสภาพแวดล้อมการใช้งานจริงที่ซับซ้อนและเปลี่ยนแปลงได้
อย่างไรก็ตาม Wang Guangrun หัวหน้านักวิทยาศาสตร์ของ Tuoyuan Intelligence ชี้ให้เห็นว่าโมเดลหลายรูปแบบในปัจจุบันส่วนใหญ่ใช้สถาปัตยกรรมทางเทคนิคเมื่อ 7 ปีที่แล้ว แม้ว่าโมเดลเหล่านี้จะมีความก้าวหน้าไปบ้าง แต่ก็ยังมีข้อบกพร่องหลายประการ เช่น สูง ค่าใช้จ่ายในการฝึกอบรมและการอนุมาน มีอาการประสาทหลอนง่าย วางแผนระยะยาวไม่ดี และไม่สามารถทำงานที่ซับซ้อนให้เสร็จสิ้นได้โดยอิสระ
Wang Guangrun เปิดเผยว่า เพื่อตอบสนองต่อปัญหาเหล่านี้ Tuoyuan Intelligence ได้เสนอแนวคิดเชิงนวัตกรรมเพื่อปรับโฉมรากฐานของโมเดลขนาดใหญ่หลายรูปแบบผ่านสถาปัตยกรรมทางเทคนิคใหม่ “สถาปัตยกรรมที่เป็นนวัตกรรมนี้ไม่เพียงแต่ช่วยลดต้นทุนการฝึกอบรมและการทดสอบโมเดลขนาดใหญ่ได้อย่างมาก แต่ยังช่วยลดเกณฑ์สำหรับองค์กรขนาดเล็กและขนาดกลางในการเข้าสู่ยุคของโมเดลขนาดใหญ่ได้อย่างมาก ซึ่งจะช่วยส่งเสริมความเท่าเทียมกันของเทคโนโลยี”
การก่อสร้างโครงสร้างพื้นฐานด้านคอมพิวเตอร์เร่งความเร็วขึ้น
การพัฒนาและการประยุกต์ใช้โมเดลขนาดใหญ่นั้นขึ้นอยู่กับการรองรับพลังการประมวลผลอันทรงพลังเป็นอย่างมาก Liu Zhaoyang กล่าวว่าพลังการประมวลผลเป็นทรัพยากรที่หายากที่สุดในยุคนี้ โดยพื้นฐานแล้วพลังการประมวลผลจะกลายเป็นรากฐานที่สำคัญที่สุดสำหรับการพัฒนาทุกองค์กรหรือการพัฒนาปัญญาประดิษฐ์
เกา เหวิน นักวิชาการของ Chinese Academy of Engineering ผู้อำนวยการห้องปฏิบัติการ Pengcheng และศาสตราจารย์ Boya แห่งมหาวิทยาลัยปักกิ่ง เน้นย้ำว่าการพัฒนาแบบจำลอง เช่น GPT ต้องอาศัยข้อมูลขนาดใหญ่ โมเดลขนาดใหญ่ และพลังการประมวลผลขนาดใหญ่ เป็นองค์ประกอบหลักของความสามารถในการแข่งขันระดับชาติ และการสร้างพลังการประมวลผล เครือข่ายพลังงานมีความสำคัญและจำเป็นต้องแก้ไขความท้าทาย เช่น แหล่งจ่ายไฟการประมวลผลหลัก การเชื่อมต่อการสื่อสาร และการจัดตารางเวลาพลังงานการประมวลผล เพื่อส่งเสริมการพัฒนาและการประยุกต์ใช้ AI
เมื่อเทียบกับพื้นหลังนี้ บริษัทชั้นนำจำนวนมากขึ้นเรื่อยๆ ยังคงเพิ่มการลงทุนในการก่อสร้างโครงสร้างพื้นฐานขนาดใหญ่
Chen Xi รองผู้จัดการทั่วไปแผนกเทคโนโลยีสารสนเทศของ China Merchants Bank สำนักงานใหญ่ เปิดเผยว่า ขณะนี้ธนาคารกำลังเร่งสร้างแพลตฟอร์มคลาวด์ AI เพื่อมอบความสามารถพื้นฐานและแพลตฟอร์มบริการโมเดลที่จำเป็นสำหรับแอปพลิเคชันธุรกิจ AI โดยมุ่งเน้นไปที่ คลัสเตอร์การฝึกอบรมและคลัสเตอร์การอนุมาน การสร้างโครงสร้างพื้นฐานทางคอมพิวเตอร์
เฉิน ซี กล่าวว่า "สามปีสู่คลาวด์" ที่กล่าวถึงก่อนหน้านี้เป็นคลาวด์แบบครอบคลุม เมื่อมีการเกิดขึ้นของโมเดลขนาดใหญ่ สัดส่วนของการประมวลผลอัจฉริยะจะมีมากขึ้นเรื่อยๆ และไม่เพียงแต่การอัพเกรดโครงสร้างพื้นฐานเท่านั้น แต่ยังเกี่ยวข้องกับ การพัฒนาระดับสูงขึ้น
Liu Zhaoyang ชี้ให้เห็นว่าหลังจากที่ GPT เริ่มจอง Transformer ขนาดใหญ่ในปี 2020 หรือ 2021 ทั้งจำนวนและขนาดของโมเดลขนาดใหญ่ ตลอดจนความต้องการพลังการประมวลผลและข้อมูลของโมเดลขนาดใหญ่ที่อยู่เบื้องหลัง จะแสดงการเติบโตแบบทวีคูณอย่างมีนัยสำคัญ แนวโน้ม.
ภายใต้แนวโน้มดังกล่าว โมเดลขนาดใหญ่ยังนำมาซึ่งความท้าทายที่มากขึ้นในการรองรับพลังการประมวลผล
โจว เหว่ย หัวหน้าสถาปนิกของ Kunlun Core Financial ชี้ให้เห็นว่าอัตราการเติบโตของความต้องการพลังงานการประมวลผลสำหรับรุ่นขนาดใหญ่นั้นสูงกว่าอัตราการเติบโตของฮาร์ดแวร์เอง ซึ่งเรียกว่ากฎของมัวร์ในเวลาเดียวกัน บริบทการแข่งขันระหว่างจีนและสหรัฐอเมริกาโดยเฉพาะชิปในประเทศยังคงอยู่ จะมีปัญหาคอติด “โดยทั่วไปแล้ว พาวเวอร์ซัพพลายสำหรับคอมพิวเตอร์ทั่วโลกไม่สามารถตอบสนองความต้องการซอฟต์แวร์ในปัจจุบันได้”
นอกจากนี้ Zhou Wei ยังกล่าวอีกว่าวิธีประเมินว่าพลังการประมวลผลบางอย่างสามารถตอบสนองความต้องการได้หรือไม่นั้น ไม่เพียงแต่ขึ้นอยู่กับพลังการประมวลผลเท่านั้น แต่ยังขึ้นอยู่กับตัวบ่งชี้ที่ครอบคลุมด้วย ในมุมมองของ Zhou Wei เป็นที่ยอมรับกันโดยทั่วไปว่าพลังการประมวลผลไม่ใช่ตัวบ่งชี้ง่ายๆ เช่น การคำนวณตัวเลขทศนิยมหรือความถี่หลักหรือหมายเลขคอร์อย่างง่าย แต่เป็นมูลค่าที่ครอบคลุมของความสามารถด้านฮาร์ดแวร์ที่แตกต่างกันในการประมวลผล การจัดเก็บ และการสื่อสาร
Zhou Wei เน้นย้ำว่าเพื่อที่จะตอบสนองความต้องการของโมเดลขนาดใหญ่ก่อนการฝึกอบรมหรือการปรับแต่งพลังการประมวลผลอย่างละเอียด พลังการประมวลผลที่แตกต่างกันจะต้องถูกใช้เป็นกลุ่มทรัพยากรการประมวลผลแบบผสมที่ต่างกัน และงานการฝึกอบรม งานการอนุมาน และ Agent, Rag
ขณะเดียวกันก็เสริมสร้างการลงทุนในการสร้างโครงสร้างพื้นฐานด้านพลังงานการประมวลผล สถาบันการเงินบางแห่งก็เริ่มให้ความสนใจกับการปรับปรุงความสามารถด้านนวัตกรรมของผู้มีความสามารถด้านเทคโนโลยีทางการเงิน เพื่อช่วยเหลือในการสร้างโมเดลขนาดใหญ่ของ AI และการสำรวจแนวทางปฏิบัติของแอปพลิเคชันต่อไป
โจว เทียนหง กล่าวว่า เมื่อมองไปสู่อนาคต สังคมมนุษย์กำลังจะเข้าสู่ยุคอัจฉริยะ ในยุคไอน้ำ ยุคไฟฟ้า และยุคสารสนเทศ มีเพียงความเจริญรุ่งเรืองของการประยุกต์ใช้เทคโนโลยีเท่านั้นที่สามารถส่งเสริมการพัฒนาโดยรวมของ "AI + การเงิน"
Gao Xulei ผู้อำนวยการสำนักงานพัฒนาการเงินดิจิทัลของ China Merchants Bank สำนักงานใหญ่ ยังเปิดเผยว่าธนาคารได้เปิดตัวโปรแกรมการเรียนรู้การเงินดิจิทัล Pujiang เพื่อเพิ่มความถี่และความหนาแน่นของการแลกเปลี่ยน และมุ่งมั่นที่จะสร้างทิศทางที่เป็นนวัตกรรมมากขึ้น ในมุมมองของ Gao Xulei นวัตกรรมไม่ได้เกิดขึ้นอย่างโดดเดี่ยว แต่เบ่งบานเมื่อมีความคิด ประสบการณ์ และวัฒนธรรมมาบรรจบกันในสภาพแวดล้อมที่เหมาะสม “ในคลื่นแห่งการเงินดิจิทัล ทุกคนเป็นพยาน มีส่วนร่วม และผู้สร้าง ฉันหวังว่าสถาบันการเงินทุกแห่งจะสามารถร่วมกันศึกษากฎหมายการพัฒนาของการเงินดิจิทัล ลองใช้โมเดลและวิธีการที่เป็นนวัตกรรมใหม่ และร่วมกันส่งเสริมการพัฒนาและการประยุกต์ใช้เทคโนโลยีที่ล้ำสมัย เทคโนโลยีการเงินดิจิทัล”