ฉุย หลิงหลิง ผู้จัดการทั่วไปฝ่ายกิจการสิทธิบัตรของ Baidu Group เปิดตัว "Baidu Top Ten Technological Frontier Inventions in 2024" ซึ่งเป็นสิ่งประดิษฐ์ที่ได้รับการจดสิทธิบัตรล้ำสมัยของ Baidu ในด้านปัญญาประดิษฐ์ ครอบคลุมความก้าวหน้ารอบด้าน ตั้งแต่อัลกอริทึมพื้นฐานไปจนถึงการใช้งาน สถานการณ์ ตาม "รายงานการวิเคราะห์เทคโนโลยีสิทธิบัตรปัญญาประดิษฐ์รุ่นใหม่" ที่เผยแพร่โดยศูนย์วิจัยการพัฒนาความมั่นคงปลอดภัยข้อมูลอุตสาหกรรมแห่งชาติและศูนย์ทรัพย์สินทางปัญญาอิเล็กทรอนิกส์ของกระทรวงอุตสาหกรรมและเทคโนโลยีสารสนเทศในเดือนเมษายนปีนี้ ณ สิ้นปี 2566 ไป่ตู้ ได้ยื่นขอรับสิทธิบัตร 19,308 ฉบับในสาขาปัญญาประดิษฐ์ทั้งหมด และได้รับสิทธิบัตร 9,260 ฉบับ และได้รับอนุมัติ 651 ฉบับในสาขา AI รุ่นใหม่ที่มีโมเดลขนาดใหญ่เป็นแกนหลัก เป็นผู้นำด้านนวัตกรรมเทคโนโลยีและรูปแบบสิทธิบัตร จากข้อมูลเชิงลึกด้านสิทธิบัตรปัญญาประดิษฐ์เชิงสร้างสรรค์ที่เผยแพร่โดยองค์กรฐานข้อมูลสิทธิบัตร IFI ระบุว่า การยื่นขอรับสิทธิบัตรปัญญาประดิษฐ์เชิงสร้างสรรค์ของไป่ตู้ติดหนึ่งใน 10 อันดับแรกของโลก เป็นนวัตกรรมจีนเพียงชนิดเดียวที่เข้าข่าย และเทคโนโลยีที่ได้รับสิทธิบัตรครอบคลุมข้อความด้วย รูปภาพ เสียง และวิดีโอ ในสาขาพื้นฐานขนาดใหญ่ บริษัทได้กลายเป็นหนึ่งในสี่บริษัทของโลกที่มีรูปแบบที่ครอบคลุมในสี่สาขานี้
ในวันที่ 12 พฤศจิกายน งาน Baidu World 2024 ในธีม "Applications Are Here" จะจัดขึ้นที่เซี่ยงไฮ้ ในฐานะการประชุมเทคโนโลยีที่มีชื่อเสียงแห่งปี Baidu จะเปิดเผยผลงานล่าสุด พร้อมนำเสนอความก้าวหน้าทางเทคโนโลยีที่สะดุดตาและการเปิดตัวผลิตภัณฑ์อีกครั้ง
สิ่งประดิษฐ์ทางเทคโนโลยีล้ำสมัย 10 อันดับแรกของ Baidu ในปี 2567 มีดังนี้:
1. เทคโนโลยีเอเจนต์ที่ใช้โมเดลขนาดใหญ่
เทคโนโลยีการประดิษฐ์นี้นำเสนอแบบจำลองการคิดอย่างสร้างสรรค์ ซึ่งช่วยให้ตัวแทนมีความสามารถที่หลากหลาย เช่น การวางแผนงาน การเรียกใช้เครื่องมือ การเพิ่มพูนความรู้ และวิวัฒนาการของการไตร่ตรอง ด้วยการออกแบบที่เป็นระบบและการเพิ่มประสิทธิภาพทิศทางของความสามารถหลัก ทำให้สามารถรองรับการสร้างและการใช้งานตัวแทนขนาดใหญ่ในสถานการณ์การใช้งานที่แตกต่างกันด้วยต้นทุนที่ต่ำ โดยการสร้างความสามารถในการจำลองขนาดใหญ่ จะช่วยเร่งการสร้างและกระจายตัวแทนได้ ระบบทางเทคนิคนี้ถูกนำไปใช้อย่างประสบความสำเร็จในสถานการณ์สำคัญๆ มากมาย เช่น Wenxin Intelligent Platform, Merchant Intelligent Agent, Wenxin Quick Code เป็นต้น ซึ่งช่วยปรับปรุงประสิทธิภาพการวิจัยและพัฒนาของตัวแทนอัจฉริยะอย่างมีนัยสำคัญ และลดเกณฑ์การวิจัยและพัฒนาลง ตัวแทนผู้ค้าใช้เทคโนโลยีการวางแผน + การทำงานร่วมกันหลายรูปแบบโดยผู้เชี่ยวชาญ และเทคโนโลยีการจำลองขนาดใหญ่ เพื่อปรับปรุงความสามารถในการสะท้อน พัฒนา และใช้เครื่องมือ และสร้างความสามารถทางการตลาดด้วย AI; Wenxin Kuaicode อาศัยคำแนะนำโค้ดและระบบตัวแทนในการผสานรวมด้วย DevOps แบบดั้งเดิม การผสมผสานแบบออร์แกนิกของห่วงโซ่เครื่องมือส่งเสริมการสำรวจในเชิงลึกและการใช้งานการเขียนโปรแกรมคู่ที่ทำงานร่วมกันระหว่างมนุษย์และเครื่องจักร
2. เทคโนโลยีวิวัฒนาการร่วมหลายรูปแบบตามกรอบการฝึกอบรมที่มีประสิทธิภาพของโมเดลขนาดใหญ่
เทคโนโลยีที่สร้างสรรค์นี้เอาชนะปัญหาที่ยากลำบากทั้งจากมุมมองทางวิศวกรรมและอัลกอริธึม ในแง่ของสถาปัตยกรรมวิศวกรรม ความก้าวหน้าทางนวัตกรรมรอบด้าน ได้แก่ กลยุทธ์แบบคู่ขนานแบบไฮบริด ประสิทธิภาพการสื่อสาร และการเพิ่มประสิทธิภาพการประมวลผลและการจัดเก็บข้อมูล ซึ่งปรับปรุงประสิทธิภาพการฝึกอบรมโมเดลภาษาขนาดใหญ่อย่างมีนัยสำคัญ และสนับสนุนการฝึกอบรมโมเดลทั้งซีรีส์ของ Wenxin ที่มีประสิทธิภาพและมีเสถียรภาพตลอดทั้ง กระบวนการ. ในแง่ของกลยุทธ์อัลกอริทึม เราได้พัฒนาเทคโนโลยีก่อนการฝึกอบรมสำหรับการทำงานร่วมกันของโมเดลขนาดใหญ่และขนาดเล็ก การเอาชนะปัญหาทางเทคนิคของการสืบทอดความรู้ที่ยากลำบากระหว่างโมเดล การเปลี่ยนกระบวนทัศน์การฝึกของโมเดลแบบดั้งเดิม และลดต้นทุนในการฝึกโมเดลใหม่ จากสิ่งประดิษฐ์นี้ ได้มีการสร้างอุปสรรคทางเทคนิคสำหรับโมเดลขนาดต่างๆ ขึ้น ซึ่งทำให้ปริมาณการฝึกอบรมโมเดลขนาดใหญ่ของ Wenxin เพิ่มขึ้น 4.1 เท่าในปีที่ผ่านมา ช่วยให้ Wenxin Yiyan สามารถตอบสนองธุรกิจที่หลากหลายที่มีความต้องการที่แตกต่างกันและเพิ่มขีดความสามารถได้อย่างมีประสิทธิภาพ หลายพันอุตสาหกรรม
3. ระบบอัจฉริยะที่รวมการสร้างและรวบรวมเนื้อหาหลายรูปแบบโดยใช้แบบจำลองขนาดใหญ่และเทคโนโลยีการเพิ่มประสิทธิภาพการสืบค้นความรู้
เทคโนโลยีของการประดิษฐ์นี้ใช้เทคโนโลยีอย่างครอบคลุม เช่น การเพิ่มพูนความรู้ การวิเคราะห์เนื้อหาจากหลายแหล่ง การแก้ไขแบบรวม และพจนานุกรมที่ปรับปรุงการดึงข้อมูล เพื่อแก้ไขปัญหา เช่น คุณภาพการผลิตที่อ่อนแอของบทความขนาดยาวระดับมืออาชีพและเนื้อหาหลายรูปแบบ ไม่สามารถแชร์คอนเทนเนอร์ได้เมื่อ การสร้างและแก้ไข และความถูกต้องของเนื้อหาหลักของพจนานุกรมไม่ดี การดึงภาพข้อความที่ได้รับการปรับปรุงมีจุดมุ่งหมายเพื่อปรับเปลี่ยนภาพอ้างอิงผ่านการตัดสินอย่างชาญฉลาดถึงความต้องการของผู้ใช้ ระบบการสร้างภาพในโหมดผสมช่วยปรับปรุงความสอดคล้องของเนื้อหาหลักของภาพได้อย่างมาก ชดเชยข้อบกพร่องของคำอธิบายเนื้อหาหางยาวที่ไม่ถูกต้องได้อย่างมีประสิทธิภาพ โดยรวม ผลกระทบเกินกว่าระบบดั้งเดิมของ Wenshengtu มาก Baidu Wenku ประสบความสำเร็จอย่างมากในการสร้างรายงานการวิจัยในอุตสาหกรรม การนำเสนอ แผนที่ความคิด และหนังสือการ์ตูนแบบเรียลไทม์ตามคำแนะนำของผู้ใช้และเนื้อหาที่อัปโหลด และสนับสนุนงานที่ซับซ้อน เช่น การแก้ไขแบบครบวงจร การแปลงข้ามโมดัล และทั่วไป/ ภาพวาดส่วนบุคคลการปรับปรุงประสิทธิภาพที่สำคัญ ในเดือนสิงหาคม 2024 Yuehu Data ของ Aurora เผยแพร่รายงานที่แสดงให้เห็นว่าส่วนแบ่งตลาด PPT อัจฉริยะของ Baidu Wenku สูงถึง 80% ในช่วงสามเดือนที่ผ่านมา อัตราการเติบโตของขนาดผู้ใช้สูงถึง 23% และอัตราการเติบโตนั้นสูงกว่าระดับอุตสาหกรรมมาก .
4. รองรับการกำหนดตำแหน่งการขับขี่อัตโนมัติขนาดใหญ่และเทคโนโลยีการสร้างแผนที่ระดับเลน
เทคโนโลยีอันสร้างสรรค์นี้ทำลายปัญหาด้านประสิทธิภาพและต้นทุนของโมเดลดั้งเดิม ลดต้นทุนการผลิตแผนที่ลง 95% และมีระยะทางบนถนนระดับเลนมากกว่า 3.6 ล้านกิโลเมตร ครอบคลุมพื้นที่เมืองและชนบทอย่างครอบคลุมมากกว่า 41,000 แห่ง เมืองทั่วประเทศ เทคโนโลยีการกำหนดตำแหน่งที่มีความแม่นยำสูงสำหรับการขับขี่อัตโนมัติโดยใช้เซ็นเซอร์หลายรูปแบบที่สร้างขึ้นเพิ่มเติมตามข้อมูลแผนที่มีความแม่นยำระดับเซนติเมตร ซึ่งปรับปรุงการผลิตจำนวนมากอย่างมาก และลดปริมาณของแพ็คเกจแผนที่ที่การวางตำแหน่งด้านข้างรถต้องอาศัย 97.5% และความน่าเชื่อถือสูงถึง 99.9999% ซึ่งสนับสนุนการดำเนินงานขนาดใหญ่ในปัจจุบันของการขับขี่อัตโนมัติเต็มรูปแบบของ Luobo Kuaipao และตระหนักถึงการขับขี่อัตโนมัติเต็มรูปแบบในสถานการณ์ที่ซับซ้อนและยากลำบากต่างๆ เช่น ใต้สะพานข้าม ถนนหลายชั้น และอุโมงค์
5. กลไกหน่วยความจำส่วนบุคคลสำหรับหน่วยสืบราชการลับรุ่นใหญ่
เทคโนโลยีการประดิษฐ์นี้เสนอชุดกลไกหน่วยความจำที่ครอบคลุมอย่างสร้างสรรค์ โดยครอบคลุมห้าโมดูล ได้แก่ การประมวลผลหน่วยความจำ การจัดเก็บ การจัดการ การเรียกใช้งาน และการใช้งาน ทำให้โมเดลขนาดใหญ่มีความสามารถด้านหน่วยความจำส่วนบุคคล การประมวลผลหน่วยความจำใช้กลไกฮิปโปแคมปัสของมนุษย์เพื่อให้เกิดความเข้าใจในเชิงลึกและการประมวลผลข้อมูลผู้ใช้ที่แม่นยำในทุกสถานการณ์ การจัดการหน่วยความจำรองรับการเพิ่ม การลบ และการแก้ไขของผู้ใช้ รวมถึงการเพิ่ม การลบ และการแก้ไขอัตโนมัติของระบบ เพื่อให้มั่นใจว่า การอัปเดตเวลาและความแม่นยำของธนาคารหน่วยความจำ การกระตุ้นและการใช้งานหน่วยความจำ ช่วยเหลือโมเดลขนาดใหญ่เพื่อสร้างการตอบสนองแบบมนุษย์และเป็นส่วนตัวมากขึ้นผ่านการสร้างความทรงจำที่เกี่ยวข้องแบบเก็งกำไร เทคโนโลยีการประดิษฐ์นี้มีการใช้กันอย่างแพร่หลายในสถานการณ์ต่างๆ เช่น ผู้ช่วย AI อัจฉริยะ และมนุษย์ดิจิทัล
6. ระบบการสร้างแบบจำลอง การขับขี่ และสร้างมนุษย์ดิจิทัลที่สมจริงสุด ๆ จากโมเดลขนาดใหญ่
เทคโนโลยีอันสร้างสรรค์นี้เสนอชุดโซลูชั่นการสร้างแบบจำลองมนุษย์ การขับขี่ และการสร้างโมเดลดิจิทัลที่สมจริงอย่างยิ่งยวด สำหรับคนดิจิทัลอย่างแท้จริง เราได้พัฒนาการสร้างแบบจำลองแนวตั้งที่ขับเคลื่อนด้วยข้อมูล การขับขี่แบบข้ามโมดัล และโมเดลการสร้างวิดีโอแนวตั้งขนาดใหญ่ เพื่อให้เกิดการผลิตเนื้อหาดิจิทัลของมนุษย์ที่เป็นธรรมชาติและสมจริง เราสนับสนุนการโคลนแนวตั้งแบบสดในฉากแอ็กชั่นและการบดบังขนาดใหญ่โดยเฉพาะ และ ห้องถ่ายทอดสดที่ขับเคลื่อนด้วยอัจฉริยะเต็มรูปแบบแห่งแรกได้ถูกนำมาใช้ สำหรับมนุษย์ดิจิทัล 3 มิติที่สมจริงเกินจริง เราได้พัฒนาเทคโนโลยีการย้ายข้อมูลแบบโมดอลและการทำงานร่วมกันหลายตัวแทนโดยใช้โมเดลขนาดใหญ่ของ Wenxin ซึ่งบรรลุผลสำเร็จในการผลิตระดับนาทีของภาพมนุษย์ดิจิทัลที่สมจริงเกินจริงและเนื้อหาการปฏิบัติงานที่เทียบเคียงได้กับภาพยนตร์บล็อกบัสเตอร์และโทรทัศน์ และ เกมส์3เอ. เทคโนโลยีของการประดิษฐ์ในปัจจุบันมีการใช้กันอย่างแพร่หลายในผลิตภัณฑ์ของมนุษย์แบบดิจิทัลและแบบ 3 มิติจำนวนมาก เช่น การถ่ายทอดสดของมนุษย์แบบดิจิทัล การผลิตวิดีโอ และร่างกายอัจฉริยะ
7. ระบบการดึงข้อมูลเชิงพาณิชย์แบบสร้างตามรุ่นขนาดใหญ่
เทคโนโลยีการประดิษฐ์นี้ได้เปลี่ยนแปลงกระบวนการ "จัดเรียงการเรียกคืนดัชนี" แบบดั้งเดิม ทำให้ช่องทางของระบบเรียบขึ้น ลดการสูญเสียข้อมูล และเข้ารหัสข้อมูลทางธุรกิจให้เป็นพารามิเตอร์โมเดลโดยการสร้างงานการเรียนรู้ดัชนีเพื่อให้บรรลุ "แบบจำลองเป็นดัชนี" และใช้พลังของขนาดใหญ่ แบบจำลองใหม่มีความเข้าใจและความสามารถในการให้เหตุผล โดยตระหนักถึง "การสร้างและการดึงข้อมูล" กระบวนทัศน์ใหม่ช่วยเพิ่มประสิทธิภาพการวางแนวของระบบได้อย่างมากถึง 120% โครงการที่เกี่ยวข้องกับการประดิษฐ์นี้เป็นโครงการแรกที่นำมาใช้ในอุตสาหกรรม โดยตระหนักถึงการใช้งานทางอุตสาหกรรมขนาดใหญ่ ผสมผสานแบบจำลองขนาดใหญ่เข้ากับสถานการณ์การค้นหาเชิงพาณิชย์เพื่อให้ได้นวัตกรรมทางเทคโนโลยีที่หลากหลาย เพิ่มขึ้น 37 เท่า ส่งผลให้คุณภาพเชิงสร้างสรรค์ เพิ่มขึ้น 92% และบรรลุผลประโยชน์ทางธุรกิจที่สำคัญและอิทธิพลทางเทคนิคในวงกว้าง
8. เทคโนโลยีมู่เล่ข้อมูลรุ่นขนาดใหญ่
เทคโนโลยีที่คิดค้นขึ้นนี้จะระบุข้อบกพร่องของแบบจำลองโดยอัตโนมัติ และสังเคราะห์ข้อมูลการฝึกอบรมคุณภาพสูงและหลากหลายได้อย่างมีประสิทธิภาพ โดยการบูรณาการข้อมูลจากแหล่งและรูปแบบต่างๆ เช่น ความคิดเห็นของผู้ใช้ ความคิดเห็นในการดำเนินการ และความคิดเห็นที่ควบคุมตนเอง ในเวลาเดียวกัน วิธีการเรียนรู้แบบเสริมกำลังรวมกับผลตอบรับจากหลายแหล่งช่วยปรับปรุงผลการฝึกโมเดลได้อย่างมาก เทคโนโลยีที่เป็นนวัตกรรมนี้สร้างมู่เล่ข้อมูลที่สามารถปรับปรุงตัวเองได้อย่างต่อเนื่อง ทะลุผ่านจุดคอขวดของข้อมูลของโมเดลขนาดใหญ่ได้อย่างมีประสิทธิภาพ ลดต้นทุนในการรับข้อมูล ปรับปรุงความสามารถในการปรับตัวและความทนทานของโมเดลขนาดใหญ่ และการปรับปรุงประสิทธิภาพของโมเดลในสถานการณ์งานต่างๆ การพัฒนาอย่างต่อเนื่องของโมเดลขนาดใหญ่
9. เทคโนโลยีอนุมานแบบจำลองขนาดใหญ่ที่มีประสิทธิภาพ
เทคโนโลยีการให้เหตุผลที่มีประสิทธิภาพที่เสนอโดยเทคโนโลยีการประดิษฐ์นี้ เลเยอร์โมเดลพื้นฐานนั้นขึ้นอยู่กับ Flying Paddle Framework ในทิศทางของสถาปัตยกรรมการให้เหตุผล มันยังคงสร้างสรรค์สิ่งใหม่ๆ ในทิศทางของ PrefixCaching, Lookahead, PagedAttention, การแยก PD กระแสหลัก ฯลฯ และผสมผสานเทคโนโลยีต่างๆ เข้าด้วยกันอย่างมีประสิทธิภาพเพื่อปรับปรุงปริมาณงานและประสิทธิภาพของโมเดลอย่างมาก ในแง่ของการบีบอัดโมเดลขนาดใหญ่ บริษัทใช้เทคโนโลยีการวัดปริมาณแบบไม่สูญเสียการสูญเสียของโมเดลขนาดใหญ่ และเปิดใช้งานวิธีการต่างๆ เช่น การปรับการแบ่งส่วนให้เรียบและการจัดเรียงการเชื่อมโยงน้ำหนักใหม่ ถือเป็นรายแรกในอุตสาหกรรมที่ได้รับการบีบอัดแบบไม่สูญเสียประสิทธิภาพของโมเดลขนาดใหญ่จำนวนนับหมื่นล้านและหลายร้อยรายการ พันล้าน สิ่งประดิษฐ์นี้สนับสนุนวิธีการบีบอัดโมเดลขนาดใหญ่และการเร่งความเร็วการอนุมานที่หลากหลาย และได้ถูกนำมาใช้ในธุรกิจหลัก เช่น แพลตฟอร์มโมเดลขนาดใหญ่ Baidu Intelligent Cloud Qianfan เพื่อลดการใช้ทรัพยากรของการอนุมานโมเดล ประหยัดค่าใช้จ่ายในการปรับใช้โมเดลขนาดใหญ่ได้มากกว่า 50% และ ปรับปรุงประสิทธิภาพของโมเดลและปริมาณงานของโมเดล ปรับปรุง 3-5 เท่า
10. ระบบการสร้างการดึงข้อมูลขับเคลื่อนโดยผลตอบรับข้อมูลผู้ใช้
ระบบการสร้างการดึงข้อมูลที่เสนอโดยเทคโนโลยีที่สร้างสรรค์นี้สามารถรวมสัญญาณตอบรับพฤติกรรมของผู้ใช้เพื่อให้สามารถเสริมกำลังตนเองได้อย่างรวดเร็ว การจัดแนวความต้องการของผู้ใช้โดยตรงผ่านการสร้างแบบจำลองความพึงพอใจและการเรียนรู้แบบเสริมแรง และใช้ผลตอบรับของผู้ใช้เพื่อกระตุ้นการสะท้อนระบบอย่างรวดเร็ว การแก้ปัญหาประสิทธิภาพผลตอบรับของผู้เชี่ยวชาญต่ำและความยากลำบากในการสร้างแบบจำลองการตั้งค่าของผู้ใช้ในแอปพลิเคชันข้อมูลแบบดั้งเดิม ระบบการสร้างการดึงข้อมูลตามเฟรมเวิร์กนี้ครอบคลุมปริมาณการค้นหา 18% และมีการใช้กันอย่างแพร่หลายในข้อความ วิดีโอ รูปภาพ และสถานการณ์การค้นหาอื่น ๆ คุณลักษณะขนาดใหญ่และสามารถรีไซเคิลได้ของความคิดเห็นจากผู้ใช้หลายรายช่วยให้ระบบสามารถปรับตัวเข้ากับการเปลี่ยนแปลงข้อมูล ผลิตภัณฑ์ และสภาพแวดล้อมได้อย่างรวดเร็ว ช่วยให้ระบบแสวงหาการปรับให้เหมาะสมโดยอัตโนมัติ และเร่งวิวัฒนาการของระบบไปสู่สถานะในอุดมคติ ซึ่งมีคุณค่าในทางปฏิบัติที่สูงมาก และ ความสามารถในการแข่งขันทางการตลาด