ยุคแอปพลิเคชั่น AI มาถึงแล้วจริงหรือ?
ธีมของการประชุม Baidu World Conference ประจำปีนี้คือ "Applications are Coming" โดย ณ ต้นเดือนพฤศจิกายน ยอดการโทรเฉลี่ยต่อวันของโทรศัพท์รุ่นใหญ่ของ Baidu Wenxin ทะลุ 1.5 พันล้านครั้ง เพิ่มขึ้นประมาณ 30 เท่า เทียบกับ 50 ล้านครั้งต่อวันที่เปิดเผยครั้งแรกในหนึ่งปี ที่ผ่านมา. Robin Li กล่าวว่า "กราฟการเติบโตที่สูงชันนี้แสดงให้เห็นถึงการขยายตัวของแอปพลิเคชันโมเดลขนาดใหญ่ในประเทศจีนในช่วงสองปีที่ผ่านมา"
ในฐานะรูปแบบแอปพลิเคชัน AI กระแสหลัก เจ้าหน้าที่อัจฉริยะกำลังจะถึงจุดแตกหัก โรบิน หลี่เน้นย้ำว่า "มันจะกลายเป็นผู้ให้บริการเนื้อหา ข้อมูล และบริการรายใหม่ในยุคดั้งเดิมของ AI"
เนื่องจาก "ในด้านหนึ่ง เกณฑ์ในการสร้างตัวแทนยังต่ำเพียงพอ ในทางกลับกัน เพดานของตัวแทนก็สูงพอที่จะสร้างแอปพลิเคชันที่มีประสิทธิภาพมากได้ ." คำถาม."
Robin Li สาธิตตัวแทน 4 ประเภทที่แตกต่างกันในการประชุม รวมถึงตัวแทนของบริษัท ตัวแทนตามบทบาท ตัวแทนเครื่องมือ และตัวแทนในอุตสาหกรรม ในบรรดาข้อมูลเหล่านี้ ข้อมูลอย่างเป็นทางการของบริษัทมีแนวโน้มที่จะเข้ามาแทนที่เว็บไซต์อย่างเป็นทางการ และกลายเป็นอินเทอร์เฟซที่ติดต่อกับผู้บริโภคโดยตรงที่สุด
“ตัวแทนแบบบริษัทเทียบเท่ากับเว็บไซต์อย่างเป็นทางการของบริษัทในยุค AI ตัวแทนแบบบริษัทมีความสามารถทั้งหมดที่เว็บไซต์ทางการแบบเดิมมี เช่น แนะนำบริษัท รูปภาพผลิตภัณฑ์และการแสดงพารามิเตอร์ ที่ตั้งร้านค้าออฟไลน์ เป็นต้น แต่ เว็บไซต์แบบดั้งเดิมไม่มีความสามารถในการให้คำแนะนำในเชิงรุก การตอบสนองอย่างทันท่วงที และความสามารถในการให้บริการแบบตัวต่อตัวก็มีอยู่ในตัวแทนอัจฉริยะของบริษัทเช่นกัน”
นอกจากนี้ Robin Li ยังได้เปิดตัวเครื่องมือปลอดโค้ด "Miaida" ซึ่งเป็นซอฟต์แวร์ที่ประกอบด้วยโมเดลและเอเจนต์ขนาดใหญ่ที่สามารถเข้าใจแนวคิดต่างๆ ได้โดยไม่ต้องเขียนโค้ด รวมถึงการเขียนโปรแกรมแบบไร้โค้ด การทำงานร่วมกันแบบหลายเอเจนต์ และการเรียกใช้งานต่างๆ ในวงกว้าง เครื่องมือนี้และ ความสามารถอื่นๆ คือ "เครื่องมือการทำงานร่วมกันหลายตัวแทนที่ซับซ้อนที่สุดในประวัติศาสตร์ของมนุษย์จนถึงขณะนี้"
ด้วยความช่วยเหลือของ "Miaoda" ผู้ใช้สามารถสร้างระบบทั้งหมดให้เสร็จสมบูรณ์ได้ผ่านการโต้ตอบด้วยภาษาธรรมชาติ และยังสามารถใช้งานแอปพลิเคชันต่างๆ ได้ในทุกสถานการณ์ ด้วยการปรับปรุงความสามารถของโมเดลพื้นฐานและวิวัฒนาการของความสามารถทางเทคนิคของ Miaoda เอง ทำให้สามารถทำได้มากขึ้น สิ่งที่ซับซ้อนมากขึ้นในอนาคต "ซึ่งหมายความว่าคุณไม่จำเป็นต้องรับสมัครผู้จัดการโครงการ นักออกแบบ นักพัฒนา ผู้ทดสอบ ฯลฯ คุณสามารถมอบหมายให้ตัวแทนหลายคนทำงานร่วมกันให้เสร็จสิ้นได้" ทีม.
ในคำพูดของ Robin Li กับ Miaoda เราจะนำเข้าสู่ "ยุคที่คุณสามารถสร้างรายได้เพียงแค่อาศัยแนวคิด"
หลังจากที่ธุรกิจฝั่ง C ของ Baidu Netdisk ถูกจัดประเภทใหม่เป็น Mobile Ecosystem Group (MEG) ในเดือนกันยายน และถูกครอบครองโดย Wang Ying รองประธาน Baidu และหัวหน้าห้องสมุด Baidu และ Baidu Netdisk ในการประชุมระดับโลกครั้งนี้ Baidu The network disk และห้องสมุดได้รับการบูรณาการเพิ่มเติม
Wang Ying เล่าถึงการเปลี่ยนแปลงใหม่ของ Baidu ในด้านการผลิตและการบริโภคเนื้อหาในการประชุม เธอกล่าวว่าการสร้างและการบริโภคเนื้อหาในปัจจุบันเผชิญกับความท้าทายมากมาย เช่น เครื่องมือที่ซับซ้อน วงจรการผลิตที่ยาวนาน และประสิทธิภาพการบริโภคต่ำ ด้วยเหตุนี้ Baidu Wenku และ Netdisk จึงได้นำเทคโนโลยี AI มาใช้เพื่อทำลายข้อจำกัดของเครื่องมือและขอบเขตของโมดัล และบรรลุประสบการณ์เนื้อหาที่อิสระและมีประสิทธิภาพมากขึ้น
การสร้าง PPT อัจฉริยะของ Baidu Wenku, การสร้างกระดาษ AI, การผลิตหนังสือภาพ AI, ความสามารถในการค้นหาของ AI และการสร้างนวนิยายและการ์ตูนของ AI ได้ปรับปรุงประสิทธิภาพและคุณภาพของการผลิตเนื้อหาอย่างมีนัยสำคัญ ในเวลาเดียวกัน ในแง่ของการบริโภค Baidu Netdisk ได้เปิดตัว เครื่องมือง่ายๆ เช่น การสแกน การเขียนตามคำบอกอย่างง่าย และการสรุปวิดีโอ AI ช่วยให้ผู้ใช้สามารถประมวลผลและทำความเข้าใจข้อมูลได้อย่างมาก
โดยเฉพาะในสถานการณ์ในสำนักงาน Baidu Wenku มี PPT อัจฉริยะและฟังก์ชันการวิจัยและการรายงานอัจฉริยะ ในขณะที่ Baidu Netdisk มีฟังก์ชันต่างๆ เช่น บันทึกการฟังแบบง่ายๆ ในสถานการณ์การเรียนรู้ ผู้ใช้สามารถใช้สมุดวาดภาพอัจฉริยะและการค้นหารูปภาพของ Baidu Wenku ในแง่ของฟังก์ชันคำถาม Baidu Netdisk นำเสนอเครื่องมือการเรียนรู้เสริม เช่น การตีความวิดีโอและคำศัพท์ Panpan ในแง่ของความบันเทิง Baidu Wenku นำเสนอนิยายอัจฉริยะและการ์ตูนอัจฉริยะ และ Baidu Netdisk มีฟังก์ชันต่างๆ เช่น การแก้ไขภาพ AI การบูรณาการ Baidu Wenku และ Netdisk จะขยายสถานการณ์การใช้งานของผู้ใช้ ตระหนักถึงความชาญฉลาดและความหลากหลายของเนื้อหา และปรับปรุงประสบการณ์ผู้ใช้ให้ดียิ่งขึ้น
ฟังก์ชั่น Canvas ฟรี | แหล่งที่มาของภาพ: Baidu
นอกจากนี้ Baidu Wenku และ Netdisk ยังร่วมกันเปิดตัวระบบปฏิบัติการเนื้อหาใหม่ฟรี Canvas ระบบนี้สามารถช่วยให้ผู้ใช้ทำงานทั้งหมดได้สำเร็จตั้งแต่การค้นหาข้อมูล ไปจนถึงการแก้ไข ไปจนถึงการสร้างและแบ่งปัน ไม่เพียงแต่รองรับอินพุตและเอาท์พุตแบบเต็มรูปแบบในรูปแบบต่างๆ เท่านั้น แต่ยังเปิดใช้งานการใช้เนื้อหาระดับองค์ประกอบ เพิ่มคุณค่าให้กับการสร้างและแบ่งปัน เสรีภาพ.
ตามคำพูดของ Robin Li "ผืนผ้าใบฟรีคือไวท์บอร์ดสากลที่ได้รับพรจากโมเดลขนาดใหญ่หลายรูปแบบของ Wenxin" นวัตกรรมเหล่านี้ไม่เพียงแต่แสดงให้เห็นถึงศักยภาพมหาศาลของเทคโนโลยี AI ในด้านเนื้อหาเท่านั้น แต่ยังเป็นการประกาศถึงความเป็นไปได้มากขึ้นสำหรับการผลิตและการบริโภคเนื้อหาในอนาคต
ในการประชุมครั้งนี้ เซินโต่ว รองประธานบริหารของ Baidu Group และประธานของ Baidu Intelligent Cloud Business Group ได้แบ่งปันความคืบหน้าล่าสุดของ Baidu Intelligent Cloud ในโมเดลขนาดใหญ่และแอปพลิเคชันเนทิฟ AI เซินโต่วกล่าวว่าเทคโนโลยีโมเดลขนาดใหญ่กำลังเปลี่ยนจากการเปลี่ยนแปลงทางเทคโนโลยีไปสู่การเปลี่ยนแปลงทางอุตสาหกรรม โดยให้นิยามใหม่ของวิธีที่ผู้คนโต้ตอบกับโลกดิจิทัลและโลกทางกายภาพ และกลายเป็นองค์ประกอบสำคัญสำหรับองค์กรต่างๆ ในการเพิ่มขีดความสามารถในการแข่งขัน
Shen Dou มุ่งเน้นไปที่แพลตฟอร์ม Qianfan ซึ่งเป็นแพลตฟอร์มสำหรับการปรับแต่งโมเดลขนาดใหญ่และการพัฒนาแอปพลิเคชัน โดยให้ห่วงโซ่เครื่องมือที่หลากหลาย และลดเกณฑ์การพัฒนาแอปพลิเคชันแบบเนทีฟของ AI ลงอย่างมาก แพลตฟอร์ม Qianfan ไม่เพียงแต่ตอบสนองความต้องการที่ปรับแต่งได้สูง ขนาดใหญ่ ความพร้อมใช้งานสูง และมีความปลอดภัยสูงของแอปพลิเคชันระดับองค์กรเท่านั้น แต่ยังเปิดตัวตัวแทนเวิร์กโฟลว์อีกด้วย นวัตกรรมนี้ใช้ประโยชน์จากความเข้าใจในเจตนาและความสามารถทั่วไปของโมเดลขนาดใหญ่เพื่อเปลี่ยนเวิร์กโฟลว์ที่ซับซ้อนให้เป็นตัวแทนที่ยืดหยุ่น ซึ่งช่วยปรับปรุงประสิทธิภาพขององค์กรได้อย่างมาก ตัวอย่างเช่น China Pacific Insurance ใช้แพลตฟอร์ม Qianfan เพื่อสร้างตัวแทน "การขายเหรียญทอง" ซึ่งปรับปรุงประสิทธิภาพการบริการและประสบการณ์ผู้ใช้ในการต่ออายุประกันภัยรถยนต์อย่างมีนัยสำคัญ
Baidu Smart Cloud Qianfan |แหล่งรูปภาพ: Baidu
นอกจากนี้ แพลตฟอร์ม Baige ยังให้บริการคอมพิวเตอร์ที่เกี่ยวข้องกับโมเดลขนาดใหญ่ที่มีประสิทธิภาพ ตั้งแต่การสร้างคลัสเตอร์ไปจนถึงการฝึกโมเดลและการอนุมาน เพื่อให้มั่นใจถึงประสิทธิภาพที่เสถียรและรวดเร็วอย่างยิ่ง แพลตฟอร์มนี้แก้ปัญหาสำคัญในการปรับใช้คลัสเตอร์ขนาดใหญ่ รองรับการทำงานที่มีประสิทธิภาพ และตอบสนองความต้องการด้านพลังงานการประมวลผลของลูกค้าที่แตกต่างกัน
Shen Dou ยังสาธิตกรณีการใช้งานแพลตฟอร์ม Qianfan ในหลายอุตสาหกรรม ซึ่งรวมถึงการแพทย์เพื่อการวินิจฉัยทั่วไป ซึ่งปรับปรุงความแม่นยำของการสร้างเวชระเบียนผ่านแบบจำลองอย่างละเอียดและประหยัดเวลาของแพทย์; State Grid กำลังสำรวจแอปพลิเคชัน AI ในอุตสาหกรรมพลังงานโดยใช้ Wenxin ขนาดใหญ่ แบบอย่างและได้รับผลลัพธ์อันน่าทึ่ง นอกจากนี้ การอัพเกรดแพลตฟอร์ม XiLing 4.0 ยังช่วยให้สามารถสร้างภาพดิจิทัลของมนุษย์แบบ 3 มิติ และสร้างวิดีโอระดับมืออาชีพ ซึ่งช่วยลดต้นทุนในการผลิตวิดีโอสั้นได้อย่างมาก
Baidu Intelligent Cloud ได้สร้างโครงสร้างพื้นฐาน AI ใหม่ผ่านแพลตฟอร์ม Qianfan และ Baige ซึ่งส่งเสริมการประยุกต์ใช้เทคโนโลยีแบบจำลองขนาดใหญ่ในอุตสาหกรรมต่างๆ เพื่อปรับปรุงระดับสติปัญญาและประสิทธิภาพขององค์กร
นอกจากแอพพลิเคชั่นแล้ว Baidu ยังได้เปิดตัวฮาร์ดแวร์ในครั้งนี้ด้วย ในการประชุมดังกล่าว หลี่ หยิง รองประธาน Baidu Group และซีอีโอของ Xiaodu Technology ได้เปิดตัว "แว่นตา AI แบบเนทีฟตัวแรกที่มาพร้อมกับโมเดลขนาดใหญ่ของจีน" นั่นคือแว่นตา Xiaodu AI
แว่นตา Xiaodu AI |แหล่งรูปภาพ: Baidu
หลี่หยิงกล่าวว่าในฐานะอุปกรณ์มุมมองบุคคลที่หนึ่งสำหรับมนุษย์ ความสามารถของแว่นตา AI ในการจับภาพภาพ เสียง สถานที่ และข้อมูลอื่น ๆ จะช่วยขยายประสาทสัมผัสของผู้คนอย่างที่ไม่เคยมีมาก่อน และยังจะกลายเป็นทางเข้าคอมพิวเตอร์ของมนุษย์ที่มีประสิทธิภาพและสะดวกยิ่งขึ้นอีกด้วย ปฏิสัมพันธ์.
จากโมเดลขนาดใหญ่ Wenxin และระบบปฏิบัติการดั้งเดิม DuerOS AI ทำให้ Xiaodu AI สามารถรับรู้ฟังก์ชันต่างๆ เช่น การถ่ายภาพมุมมองบุคคลที่หนึ่ง การถามคำถามขณะเดิน การจดจำแคลอรี่ สารานุกรมการรู้จำวัตถุ การแปลภาพและเสียง และบันทึกอัจฉริยะ
ด้วยการรวมอุปกรณ์และคลาวด์เข้ากับโมเดลขนาดใหญ่ แว่นตา AI ของ Xiaodu จึงสามารถใช้งานแยกกันหรือจับคู่กับแอปได้ แว่นตาดังกล่าวมีซับในภาษาจีนในตัว และสามารถตอบคำถามของผู้ใช้ได้แบบเรียลไทม์
ในแง่ของฮาร์ดแวร์ แว่นตา Xiaodu AI ได้รับการติดตั้งไมโครโฟนสี่ตัวเพื่อจดจำเสียง การออกแบบลำโพงป้องกันการรั่วแบบเปิด เลนส์มุมกว้างพิเศษ 16 ล้านพิกเซล และอัลกอริธึมป้องกันภาพสั่นไหวของ AI ได้อย่างเต็มรูปแบบ ชาร์จเพียง 30 นาที สแตนบายได้ 56 ชั่วโมง และใช้งานต่อเนื่องได้มากกว่า 5 ชั่วโมง น้ำหนักเครื่องทั้งหมดเพียง 45 กรัม ซึ่งต่ำกว่าค่าเฉลี่ยอุตสาหกรรมที่ 49 กรัม
แว่นตา Xiaodu AI คาดว่าจะวางจำหน่ายในช่วงครึ่งแรกของปีหน้า ราคายังไม่มีการประกาศ แต่เจ้าหน้าที่ประจำบูธกล่าวว่าราคาอาจอยู่ที่ประมาณ 2,000 หยวน
Robin Li กล่าวในที่ประชุมว่าอุตสาหกรรม AI มีการเปลี่ยนแปลงครั้งสำคัญในช่วง 24 เดือนที่ผ่านมา โดยที่โดดเด่นที่สุดคือโมเดลขนาดใหญ่ได้ขจัดปรากฏการณ์ภาพหลอนโดยพื้นฐานแล้ว การเปลี่ยนแปลงนี้ทำให้ AI จาก "เรื่องไร้สาระร้ายแรง" ดั้งเดิมกลายเป็นสิ่งที่ใช้งานได้และน่าเชื่อถือ โมเดลขนาดใหญ่นั้นเป็นโมเดลความน่าจะเป็น และเนื้อหาที่สร้างขึ้นมีความไม่แน่นอนในระดับหนึ่ง อย่างไรก็ตาม ด้วยการใช้เทคโนโลยี RAG โมเดลขนาดใหญ่จึงสามารถใช้ประโยชน์จากข้อมูลที่ดึงมาเพื่อเป็นแนวทางในการสร้างข้อความหรือคำตอบ ซึ่งช่วยปรับปรุงคุณภาพและความแม่นยำของเนื้อหาได้อย่างมาก
เพื่อที่จะแก้ปัญหาภาพหลอนในการสร้างภาพ Baidu ได้พัฒนาเทคโนโลยีเมื่อต้นปีนี้ - iRAG (Image based RAG) ซึ่งเป็นเทคโนโลยีกราฟ Vincent ที่ปรับปรุงการดึงข้อมูล ก่อนหน้านี้ รูปภาพที่สร้างโดยระบบกราฟ Vincentian โดยใช้แบบจำลองภาษาขนาดใหญ่ทั้งหมดมักจะมีคุณภาพไม่ดีและไร้เหตุผลด้วยซ้ำ เทคโนโลยี iRAG ของ Baidu ผสมผสานทรัพยากรรูปภาพระดับพันล้านของ Baidu Search เข้ากับความสามารถด้านโมเดลพื้นฐานอันทรงพลัง เพื่อสร้างรูปภาพที่สมจริงเป็นพิเศษที่หลากหลาย ผลโดยรวมนั้นเหนือกว่าระบบ Vincentian ดั้งเดิมอย่างมาก และกำจัดร่องรอยของการสร้างเครื่องจักร
เนื่องจากการใช้งานรูปภาพที่สร้างโดย AI ได้รับการปรับปรุงอย่างมาก พื้นที่การใช้งานจึงขยายออกไปอย่างมากเช่นกัน ตัวอย่างเช่น ในสถานการณ์การโปรโมตแบรนด์ อาจต้องใช้เงินหลายแสนหยวนในการผลิตชุดโปสเตอร์ในอดีต แต่ตอนนี้ต้นทุนการสร้างเกือบเป็นศูนย์ กล่าวโดยย่อ มูลค่าเชิงพาณิชย์ของ iRAG สะท้อนให้เห็นในแง่มุมของการไม่มีภาพลวงตา ความสมจริงเป็นพิเศษ ต้นทุนต่ำ และความพร้อมในทันที
Robin Li ในการประชุม | แหล่งที่มาของภาพ: Baidu
เมื่อความสามารถของโมเดลพื้นฐานเติบโตขึ้น ยุคสมัยที่เจริญรุ่งเรืองของแอปพลิเคชัน AI ก็กำลังมาถึง แล้วแอปพลิเคชั่น AI มาจากไหนและจะไปที่ไหน? มีสองทิศทางหลัก: ด้านหนึ่งคือตัวแทนอัจฉริยะ และอีกด้านคือการใช้งานทางอุตสาหกรรม
ในอนาคต บางทีเมื่อช่วงเวลาที่แอปพลิเคชัน AI เจริญรุ่งเรืองมาถึงอย่างแท้จริง AI ก็สามารถตระหนักถึงภารกิจ "โอกาสระดับการปฏิวัติอุตสาหกรรม" ได้อย่างแท้จริง และนำการขยายความสามารถในการผลิตมาสู่เศรษฐกิจสังคมอย่างไร้ขีดจำกัด