เมื่อวันที่ 5 กันยายน Shun Xiangyang ประธานคณะกรรมการบริหารของ Hong Kong University of Science and Technology และนักวิชาการต่างประเทศของ National Academy of Engineering ได้แบ่งปันความคิดแปดประการของเขาเกี่ยวกับการนำอุตสาหกรรมแบบจำลองขนาดใหญ่ไปใช้ในงาน Inclusion ประจำปี 2024 ·การประชุมบันด์ เขาเชื่อว่าการมาถึงของยุค AI Agent จะไม่ใช่โมเดลที่มหัศจรรย์และทรงพลังที่จะเข้ามาแทนที่ขั้นตอนการทำงานทั้งหมดอย่างกะทันหัน โดยเป็นการบูรณาการเทคโนโลยี วิศวกรรม และการตลาดอย่างต่อเนื่อง และสุดท้ายก็นำเสนอบริการที่เหนือความคาดหมาย
ความคิดที่ 1: พลังการประมวลผลเป็นเกณฑ์ “ทุกวันนี้ ในการทำโมเดลขนาดใหญ่และการเรียนรู้เชิงลึก สิ่งแรกและสำคัญที่สุดคือการมีพลังในการประมวลผล” Shen Xiangyang กล่าว เขาชี้ให้เห็นว่าตั้งแต่ปี 2010 พลังการประมวลผลที่จำเป็นสำหรับรุ่นขนาดใหญ่เพิ่มขึ้น 6 หรือ 7 เท่า มีเสถียรภาพในช่วงไม่กี่ปีที่ผ่านมาและเติบโตขึ้นประมาณ 4 เท่าทุกปี โมเดลมีขนาดใหญ่ขึ้นเรื่อยๆ จำนวนพารามิเตอร์ก็ใหญ่ขึ้นเรื่อยๆ และความต้องการพลังการประมวลผลก็เพิ่มขึ้นในทิศทางคงที่เมื่อพารามิเตอร์เพิ่มขึ้น ในมุมมองของเขา การพัฒนาอุตสาหกรรมชิปคอมพิวเตอร์ทั้งหมดได้เปลี่ยนจาก "กฎของมัวร์" ดั้งเดิมเป็น "กฎของหวาง" กฎของมัวร์เคยกำหนดให้พลังการประมวลผลนั้นเพิ่มขึ้นสองเท่าทุกๆ 18 เดือน ขณะนี้คาดการณ์ว่า GPU จะขับเคลื่อนพลังการประมวลผลของ AI เพิ่มขึ้นสองเท่าทุกปี “การพูดถึงไพ่มันทำร้ายความรู้สึก แต่ไม่มีอารมณ์ ถ้าไม่มีไพ่ เคยมีคนบอกว่าความยากจนจำกัดจินตนาการ แต่ตอนนี้ ความยากจนอาจบิดเบือนจินตนาการได้ เพราะถ้าไม่มีไพ่ โครงการที่ สามารถจินตนาการได้อาจแตกต่างกัน "Shen Xiangyang ถอนหายใจด้วยอารมณ์ ถนน ความคิดที่ 2: ข้อมูลเกี่ยวกับข้อมูล ข้อมูลสาธารณะแสดงให้เห็นว่าข้อมูลการฝึกอบรมของ GPT3 ถึงโทเค็น (ปริมาณงาน) ที่ 2 T และของ GPT4 ถึงประมาณ 12 T ตามคำทำนายของซุ่นเซียงหยาง ข้อมูลการฝึกของ GPT5 อาจสูงถึง 200 ตัน ข้อมูลปัจจุบันบนอินเทอร์เน็ตยังห่างไกลจากการตอบสนองความต้องการของการฝึกอบรมโมเดลในอนาคต และเราจำเป็นต้องคิดถึงวิธีที่จะขุดข้อมูลเพิ่มเติม ในด้านปัญญาประดิษฐ์ ข้อมูลถือเป็น "เชื้อเพลิง" ของแบบจำลอง และแบบจำลองจำเป็นต้องเรียนรู้และดึงข้อมูลที่เป็นประโยชน์จากข้อมูลนี้ ดังนั้นปริมาณ คุณภาพ และความหลากหลายของข้อมูลจะส่งผลโดยตรงต่อความถูกต้องและประสิทธิภาพของแบบจำลอง Shen Xiangyang กล่าวว่าในอดีต Google ใช้เป็นข้อมูลส่วนใหญ่ในการสร้างเครื่องมือค้นหา ในอนาคตข้อมูลเหล่านี้จะถูกนำมาใช้ในการฝึกโมเดลขนาดใหญ่ "ข้อมูลที่สะสมทางอินเทอร์เน็ตในช่วง 40 ปีที่ผ่านมาดูเหมือนจะเป็นเพียงช่วงเวลาของ AI เท่านั้น" ความคิดที่ 3: บทต่อไปของโมเดลใหญ่ อะไรต่อไป? Shen Xiangyang เชื่อว่าเส้นทางการพัฒนาในอนาคตของอุตสาหกรรมโมเดลขนาดใหญ่นั้นชัดเจนมาก และจะย้ายจากโมเดลภาษาขนาดใหญ่ก่อนหน้านี้ไปเป็นโมเดลหลายรูปแบบ และไปสู่โมเดลโลกในอนาคต ในทางเทคนิคแล้ว เราต้องใช้เส้นทางแห่งการรวมความเข้าใจและรุ่นเข้าด้วยกัน “อนาคตจะเคลื่อนไปในทิศทางของความฉลาดและหุ่นยนต์อย่างแน่นอน หนึ่งในรูปแบบพิเศษคือการขับรถอัตโนมัติ” เสิ่นเซียงหยางกล่าว ในความเป็นจริงไม่มีคำจำกัดความมาตรฐานของแบบจำลองโลกในอุตสาหกรรม แบบจำลองโซระที่เปิดตัวโดย OpenAI ทำให้เกิดการอภิปรายเกี่ยวกับ "แบบจำลองโลก" ในอุตสาหกรรม OpenAI ถือเป็นพื้นฐานสำหรับโมเดลที่สามารถเข้าใจและจำลองโลกแห่งความเป็นจริง และเชื่อว่าความสามารถของมันเป็นก้าวสำคัญในการบรรลุ AGI (ปัญญาประดิษฐ์ทั่วไป) อย่างไรก็ตาม ชุนเซียงหยางเชื่อว่า "แม้ว่าแบบจำลองโซระจะดีมาก แต่ก็ไม่ได้ทรงพลังขนาดนั้น ไม่สามารถรับประกันคุณสมบัติทางกายภาพในนั้นได้ และไม่สามารถเป็นแบบจำลองระดับโลกได้" ความคิดที่ 4: โมเดลขนาดใหญ่ครอบคลุมอุตสาหกรรมหลายพันแห่ง รุ่นขนาดใหญ่สามารถแบ่งออกเป็นรุ่นใหญ่ทั่วไป รุ่นอุตสาหกรรมขนาดใหญ่ รุ่นขนาดใหญ่ขององค์กร และรุ่นขนาดใหญ่ส่วนบุคคล Shen Xiangyang ชี้ให้เห็นว่าโมเดลขนาดใหญ่สำหรับใช้งานทั่วไปเป็นพื้นฐานของ AI และการฝึกอบรมโมเดลขนาดใหญ่สำหรับวัตถุประสงค์ทั่วไปนั้นต้องใช้พลังงานอย่างน้อย 10,000 แคลอรี่ โมเดลขนาดใหญ่ในอุตสาหกรรมเป็นพื้นฐานสำหรับแอปพลิเคชันโดเมนและต้องมีการฝึกอบรมระดับกิโลแคลอรีในองค์กร การค้นพบคุณค่าของข้อมูลองค์กรอีกครั้ง ต้องใช้การฝึกอบรมหลายร้อยแคลอรี่ รุ่นขนาดใหญ่เหล่านี้มีข้อกำหนดด้านพลังการประมวลผลที่สูงมาก “สิ่งที่น่าตื่นเต้นที่สุดคือโมเดลส่วนบุคคลขนาดใหญ่ ตัวอย่างเช่น Lenovo และ Microsoft กำลังส่งเสริม AIPC และ Apple Intelligence ของ Apple ต่างก็พัฒนาไปในทิศทางของปัญญาส่วนบุคคล” Shen Xiangyang กล่าว ณ สิ้นเดือนกรกฎาคมปีนี้ จีนได้จดทะเบียนโมเดลขนาดใหญ่จำนวน 197 โมเดล โดย 30% เป็นโมเดลขนาดใหญ่ทั่วไป และ 70% เป็นโมเดลขนาดใหญ่ในอุตสาหกรรม “จะเห็นได้ว่าโมเดลขนาดใหญ่ในอุตสาหกรรมถือเป็นคนส่วนใหญ่ และจะมีมากขึ้นเรื่อยๆ ในอนาคตอย่างแน่นอน” เสิ่นเซียงหยางกล่าว แนวคิดที่ 5: ai agent—จากวิสัยทัศน์สู่การนำไปปฏิบัติ ในเดือนพฤษภาคม ปี 2024 Bill Gates ผู้ก่อตั้ง Microsoft เปิดเผยต่อสาธารณะว่า AI Agent จะไม่เพียงแต่เปลี่ยนวิธีที่ทุกคนโต้ตอบกับคอมพิวเตอร์เท่านั้น แต่ยังจะล้มล้างอุตสาหกรรมซอฟต์แวร์ด้วย และนำมาซึ่งการปฏิวัติการประมวลผลครั้งใหญ่ที่สุดนับตั้งแต่การพิมพ์คำสั่งไปยังการคลิกไอคอน ชุนเซียงหยางเห็นด้วยกับมุมมองนี้ เขาเชื่อว่าในยุคของปัญญาประดิษฐ์ สุดยอดแอปพลิเคชั่นที่น่าทึ่งอย่างแท้จริงคือ AI Agent ในกระบวนการของ AI Agent จากวิสัยทัศน์ไปสู่การใช้งาน จำเป็นต้องมุ่งเน้นไปที่ความต้องการอยู่เสมอ เข้าใจความสามารถของโมเดลอย่างลึกซึ้ง และสร้างขั้นตอนการทำงานที่มีส่วนร่วมของ AI อย่างลึกซึ้ง “หากคุณทำงานในบริษัททุกวันนี้ ขั้นตอนการทำงานทั้งหมดมีความซับซ้อนมาก แม้ว่า ChatGPT จะทรงพลังมาก แต่ก็ยังห่างไกลจากระดับ Agent ที่จะบรรลุความก้าวหน้าเพียงครั้งเดียว ในการก้าวไปข้างหน้าอย่างแท้จริง จะต้องบูรณาการเข้ากับ กระบวนการทำงานทั้งหมด” เขากล่าว ความคิดที่ 6: ใส่ใจกับ การกำกับดูแล ของ AI การกำกับดูแลด้าน AI มีความสำคัญมาก ธีมของการประชุมปัญญาประดิษฐ์โลก (WAIC) ประจำปีนี้คือเกี่ยวกับการกำกับดูแลด้าน AI ประเทศต่างๆ มีมุมมองที่แตกต่างกันมากมายเกี่ยวกับเรื่องนี้ การพัฒนา AI มีผลกระทบอย่างมากต่อผู้คน บริษัท การกำกับดูแลของรัฐบาล การพัฒนาสังคม และด้านอื่น ๆ และกระตุ้นให้สาธารณชนเกิดความกังวลเกี่ยวกับการกำกับดูแลด้านความปลอดภัย “ผมคิดว่าจุดสำคัญต่อไปในการพัฒนาปัญญาประดิษฐ์ จากมุมมองของประเทศต่างๆ ทั่วโลก จำเป็นต้องสร้างปัญญาประดิษฐ์อธิปไตย และเบื้องหลังปัญญาประดิษฐ์อธิปไตยจะต้องมีคลาวด์อธิปไตยเพื่อรองรับการพัฒนาอธิปไตย ปัญญาประดิษฐ์” เฉิน เซียงหยาง กล่าว ความคิดที่ 7: คิดใหม่เกี่ยวกับความสัมพันธ์ระหว่างมนุษย์กับเครื่องจักร "GPT มีผลกระทบมากน้อยเพียงใดจากการปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์ และการพัฒนาสติปัญญาของเครื่องจักรมีมากน้อยเพียงใด" Shen Xiangyang เชื่อว่าความสัมพันธ์ระหว่างมนุษย์กับเครื่องจักรควรได้รับการพิจารณาใหม่ เขาชี้ให้เห็นว่า AI ช่วยให้มนุษย์มีบริบทใหม่สำหรับการทำงานร่วมกันด้วยเทคโนโลยี และวิธีใหม่ในการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ชี้ให้เห็นถึงการบูรณาการและความก้าวหน้าของ "AI และ IA" IA (Intelligent Augmentation) แสดงถึงเส้นทางการพัฒนา AI ที่ยึดมนุษย์เป็นศูนย์กลาง โดยมุ่งเน้นไปที่การใช้เทคโนโลยีเพื่อเพิ่มขีดความสามารถของมนุษย์มากกว่าการแทนที่มนุษย์ โดยเน้นถึงความสัมพันธ์การทำงานร่วมกันระหว่างมนุษย์กับ AI "จอห์น มาร์กอฟ คอลัมนิสต์ของ New York Times กล่าวว่าในการพัฒนาคอมพิวเตอร์ในช่วงไม่กี่ทศวรรษที่ผ่านมา ผู้ชนะที่แท้จริงคือการมีปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์ ไม่ว่าเทคโนโลยีจะเป็นเช่นไร เป้าหมายสูงสุดควรคือการช่วยให้มนุษย์ใช้เครื่องจักรได้ดีขึ้น Shen Xiang Yang กล่าวว่า “ในยุค AI สิ่งสำคัญที่สุดของการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์คือบทสนทนา เช่นเดียวกับ ChatGPT ChatGPT และ Microsoft จะกลายเป็นบริษัทที่ยิ่งใหญ่ที่สุดในยุค AI หรือไม่ ฉันคิดว่าเวลาเท่านั้นที่จะเป็นเช่นนั้น” บอก." ความคิดที่ 8: ธรรมชาติของความฉลาด ในปัจจุบัน การพัฒนา GPT ดำเนินไปอย่างเต็มตัว แต่ในความเป็นจริงแล้ว ความเข้าใจด้านสติปัญญาของผู้คนยังมีจำกัดมาก แตกต่างจากฟิสิกส์ ทุกสิ่งตั้งแต่ท้องฟ้าที่เต็มไปด้วยดวงดาวไปจนถึงควอนตัมเล็กๆ สามารถอธิบายได้ด้วยทฤษฎีที่เป็นหนึ่งเดียว หลายสิ่งหลายอย่างในการเรียนรู้เชิงลึกในปัจจุบันอธิบายไม่ได้และไม่มีความทนทาน “แก่นแท้ของความฉลาดคือการต่อสู้ที่มีมายาวนานนับศตวรรษระหว่างโครงข่ายประสาทเทียมและระบบสัญลักษณ์” เสิ่น เซียงหยาง กล่าวว่า “ในปัจจุบัน แม้ว่าการพัฒนาปัญญาประดิษฐ์ยังยังอยู่ในช่วงเริ่มต้น แต่ก็มีการใช้งานมากมายในอุตสาหกรรม ซึ่ง มีค่าควรแก่ฉัน ตั้งใจแน่วแน่ที่จะทำ และมั่นใจกับอนาคต”