AI Agent (ตัวแทนอัจฉริยะ) ที่เข้าควบคุมอุปกรณ์ของมนุษย์ครั้งหนึ่งเคยเป็นเพียงแค่ฉากในภาพยนตร์นิยายวิทยาศาสตร์ แต่ปัจจุบันกลายเป็นประเด็นร้อนในตลาดหุ้น
เมื่อวันที่ 23 ตุลาคม Anthropic บริษัทสร้างโมเดล AI ขนาดใหญ่ในอเมริกา ได้เปิดตัว Claude 3.5 Haiku ใหม่และ Sonnet เวอร์ชันอัปเกรด Sonnet นำเสนอประสบการณ์ AI ใหม่ "การใช้งานคอมพิวเตอร์" ซึ่งสามารถสั่งงานคอมพิวเตอร์ได้เหมือนมนุษย์ เช่น การดูหน้าจอ เลื่อนเคอร์เซอร์ การคลิก พิมพ์ผ่านแป้นพิมพ์เสมือน เป็นต้น
สองวันต่อมา Zhipu AI ได้ติดตามการนำของ Anthropic และเปิดตัว AutoGLM โดยมีเป้าหมายที่ชัดเจนในการ "ควบคุม" โทรศัพท์มือถือของผู้ใช้ในฐานะผู้ช่วยส่วนตัว โดยสามารถทำงานส่วนตัวได้อย่างอิสระ เช่น การโต้ตอบกับ WeChat การสั่งซื้อกลับบ้าน และแม้แต่การคว้าอั่งเปา โดยมีเป้าหมายหลักอยู่ที่การดำเนินการทั่วไปของผู้ใช้ในแอป เช่น WeChat, Taobao, Meituan และ Xiaohongshu
ผลิตภัณฑ์ทั้งสองนี้แสดงถึงการเปลี่ยนแปลงของ AI จากเครื่องแชทไปสู่ขั้นตอนการใช้เครื่องมือในการแก้ปัญหา ช่วยให้ตัวแทน AI ค่อยๆ ก้าวไปสู่ผลิตภัณฑ์ที่ใช้งานได้จริงในความเป็นจริง
กระแสตัวแทน AI นี้สร้างความตื่นตระหนกให้กับตลาดทุนทันที
เมื่อตลาดเปิดทำการในตอนเช้าของวันที่ 28 ตุลาคม หุ้นที่เกี่ยวข้องกับ Zhipu ก็ถึงขีดจำกัดรายวันอย่างรวดเร็ว เช่น Parallel Technology, Capital Online, Startup Dark Horse, Doushen Education, Chuanzhi Education และ Dianguang Media หุ้นถึงขีดจำกัดรายวัน โดยเพิ่มขึ้น 20 % ถึง 30%
การตอบสนองอย่างรวดเร็วของตลาดทุนสะท้อนให้เห็นถึงความคาดหวังที่สูงสำหรับโอกาสในการขายเชิงพาณิชย์ของ AI Agent แต่โดยพื้นฐานแล้ว เนื่องจากการใช้งานที่เกี่ยวข้องยังอยู่ในช่วงเริ่มต้นของตลาด คลื่นของราคาที่สูงขึ้นนี้จึงไม่สามารถตัดความเชื่อมั่นและการเก็งกำไรของตลาดได้
AI Agent เป็นแนวโน้มระยะยาวของเทคโนโลยีในอนาคตหรือแนวโน้มระยะสั้นหรือไม่?
จากมุมมองทางเทคนิค การเพิ่มขึ้นของ AI Agent ที่มุ่งเน้นไปที่ "การใช้คอมพิวเตอร์" (การใช้คอมพิวเตอร์) และ "การใช้โทรศัพท์" (การใช้โทรศัพท์มือถือ) ถือเป็นการพัฒนา AI จากความเข้าใจภาษาเดียวไปสู่การค่อยๆ ขยายไปสู่การปฏิบัติงานที่ซับซ้อน
Claude Sonnet จาก Anthropic และ AutoGLM ของ Zhipu ไม่เพียงแต่จะประมวลผลการสนทนาด้วยภาษาธรรมชาติเท่านั้น แต่ยังควบคุมอุปกรณ์ของผู้ใช้โดยตรงเพื่อดำเนินการเฉพาะเจาะจง นี่คือขั้นตอนใหม่ของการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ การสาธิต Sonnet ของ Anthropic แสดงให้เห็นว่าสามารถจัดการกับงานต่างๆ เช่น การเขียนโค้ดและการวิเคราะห์ข้อมูล และยังสามารถลองวิธีแก้ปัญหาต่างๆ ได้เมื่อเกิดข้อผิดพลาด ความยืดหยุ่นนี้แสดงให้เห็นว่า AI กำลังเริ่มมี "พลังการดำเนินการ" บางอย่าง
AutoGLM ของ Zhipu มุ่งเน้นไปที่ฉากโทรศัพท์มือถือ ด้วยการทำความเข้าใจส่วนประกอบ UI ผ่านเทคโนโลยี OCR และทำความเข้าใจฟังก์ชันส่วนประกอบผ่านการฝึกอบรมการคิดแบบลูกโซ่ AutoGLM จึงสามารถระบุส่วนประกอบต่างๆ บนหน้าจอโทรศัพท์มือถือของผู้ใช้ ทำความเข้าใจฟังก์ชันของพวกเขา จากนั้นดำเนินการตามคำแนะนำ เช่น การโต้ตอบ WeChat อัตโนมัติและคำสั่งซื้ออีคอมเมิร์ซ .
อย่างไรก็ตาม ผลิตภัณฑ์ดังกล่าวยังคงมีข้อจำกัดในด้านประสบการณ์ผู้ใช้และการค้า
แม้ว่า AutoGLM จะทำให้การทำงานของโทรศัพท์มือถือมีความชาญฉลาดมากขึ้น แต่ก็ยังทำให้เกิดความกังวลเกี่ยวกับปัญหาความเป็นส่วนตัวและความปลอดภัยด้วย: ผู้ใช้จะละทิ้งการคุ้มครองความเป็นส่วนตัวเพื่อความสะดวกหรือไม่ นอกจากนี้ ปัจจุบัน AutoGLM ยังคงต้องการคำแนะนำที่ชัดเจนและมีข้อจำกัดในด้านความสามารถในการปรับตัวข้ามแพลตฟอร์มและความแม่นยำในการปฏิบัติงาน เพื่อให้บรรลุถึงระบบอัตโนมัติที่ราบรื่นอย่างแท้จริง จำเป็นต้องมีการปรับให้เหมาะสมอย่างต่อเนื่อง
ในแง่ของ "ความฉลาด" ที่แท้จริง AutoGLM ยังมีพื้นที่สำหรับการปรับปรุงอีกด้วย ตัวอย่างเช่น CITIC Securities ชี้ให้เห็นในรายงานการวิจัยว่าในวิดีโอสาธิตอย่างเป็นทางการ AutoGLM จ่ายเงินมากกว่า 18 หยวนเมื่อสั่งซื้อ Luckin Coffee ซึ่งเป็นของพรีเมียมที่ชัดเจน ดูเหมือนว่ายังไม่เชี่ยวชาญเรื่อง "การคว้า" ที่ซับซ้อน คูปอง" การเล่นเกมของแบรนด์เหล่านี้ .
ในแง่ของการค้าเฉพาะทาง ในเดือนกันยายน Zhipu และ Honor ได้จัดตั้งห้องปฏิบัติการเทคโนโลยีโมเดล AI ขนาดใหญ่ร่วมกัน เพื่อให้อุตสาหกรรมมองเห็นศักยภาพของ AI Agent ในแอปพลิเคชันเทอร์มินัล อย่างไรก็ตาม เนื่องจากแบรนด์มือถือที่รองรับฟีเจอร์นี้มีจำนวนจำกัด การใช้งานขนาดใหญ่จริงจึงยังต้องใช้เวลา จากข้อมูลของ IDC ส่วนแบ่งการตลาดของโทรศัพท์มือถือ AI และพีซี AI ในตลาดจีนจะเกิน 50% และ 80% ตามลำดับในปี 2570
เมื่อพิจารณาจากการจัดวางเลย์เอาต์ของยักษ์ใหญ่ด้านเทคโนโลยี AI Agent ถือเป็นสนามรบที่สำคัญในแวดวงโมเดลขนาดใหญ่
ตามข้อมูลสาธารณะ OpenAI คาดว่าจะเปิดตัวซอฟต์แวร์ AI Agent Orion ภายในสิ้นปีนี้ และ Apple จะเพิ่ม Apple Intelligence ให้กับ iOS 18.1 ในเดือนหน้า Microsoft ได้เปิดแหล่งที่มาของเครื่องมือแยกวิเคราะห์หน้าจอ OmniParser ซึ่งสามารถทำหน้าที่ต่างๆ เช่น การจองตั๋วอัตโนมัติ Geimini 2.0 ของ Google คาดว่าจะเปิดตัวในเดือนธันวาคม และโครงการใหม่ที่คล้ายกัน "Project Jarvis" กำลังได้รับการพัฒนาเพื่อทำให้งานหน้าเว็บ Chrome เป็นอัตโนมัติ
ซึ่งหมายความว่าตัวแทน AI ยังคงย้ายจากผลิตภัณฑ์ในห้องปฏิบัติการไปสู่การใช้งานจำนวนมาก และยักษ์ใหญ่ที่อยู่เบื้องหลังพวกเขาก็ก้าวเข้ามาครอบครองตลาดเช่นกัน
แนวโน้มการร่วมลงทุนในซิลิคอนวัลเลย์แสดงให้เห็นว่าบริษัทต่างๆ จำนวนมากขึ้นเรื่อยๆ กำลังเปลี่ยนจากโครงสร้างพื้นฐาน AI ไปเป็นระดับแอปพลิเคชัน และแอปพลิเคชัน AI ที่แบ่งส่วนตามแนวตั้งก็กำลังเฟื่องฟูมากขึ้น อย่างไรก็ตาม เทคโนโลยี AI Agent ในปัจจุบันยังคงเผชิญกับความท้าทาย เช่น ความสามารถในการดำเนินการข้ามแพลตฟอร์มที่ไม่เพียงพอ การพึ่งพาคำสั่งอย่างมาก และประสบการณ์ส่วนบุคคลที่จำเป็นต้องได้รับการปรับให้เหมาะสม เพื่อที่จะเข้าสู่ตลาดกระแสหลักอย่างสมบูรณ์ AI Agent จะต้องไม่เพียงแต่ปรับปรุงฟังก์ชั่นเท่านั้น แต่ยังต้องได้รับความไว้วางใจจากสาธารณะในแง่ของความเป็นส่วนตัวและความปลอดภัยของข้อมูลด้วย
ในระยะสั้น ขอบเขตการใช้งานของ AI Agent ยังมีจำกัด แต่ประสิทธิภาพและความสะดวกสบายที่ได้รับนั้นน่าดึงดูดเพียงพอ เมื่อปัญหาด้านเทคนิคและความเป็นส่วนตัวได้รับการแก้ไขแล้ว เจ้าหน้าที่ AI จะมีโอกาสมากขึ้นในการพัฒนาแอปพลิเคชันอัจฉริยะในชีวิตมนุษย์