เรากำลังยืนอยู่ที่จุดเปลี่ยนที่น่าตื่นเต้นในการพัฒนาปัญญาประดิษฐ์
ลองนึกภาพว่าปัญญาประดิษฐ์จะมีลักษณะอย่างไรในอนาคต? ด้วยคำสั่งง่ายๆ พวกเขาสามารถเข้าใจและทำงานที่ซับซ้อนได้ นอกจากนี้ยังสามารถจับภาพการแสดงออกและการเคลื่อนไหวของผู้ใช้เพื่อกำหนดสถานะทางอารมณ์ของพวกเขา นี่ไม่ใช่ฉากในภาพยนตร์นิยายวิทยาศาสตร์ฮอลลีวูดอีกต่อไป แต่เป็นยุคของเจ้าหน้าที่ AI ที่ค่อยๆ เข้าสู่ความเป็นจริง
ในช่วงต้นเดือนพฤศจิกายน 2023 Bill Gates ผู้ก่อตั้ง Microsoft เขียนว่าตัวแทนไม่เพียงแต่เปลี่ยนวิธีที่ทุกคนโต้ตอบกับคอมพิวเตอร์เท่านั้น แต่ยังจะล้มล้างอุตสาหกรรมซอฟต์แวร์และนำมาซึ่งการปฏิวัติการประมวลผลครั้งใหญ่ที่สุดนับตั้งแต่เราเริ่มพิมพ์คำสั่งเพื่อการปฏิวัติการคลิกไอคอน Sam Altman ซีอีโอของ OpenAI ยังระบุหลายครั้งว่ายุคของการสร้างแบบจำลอง AI ขนาดใหญ่สิ้นสุดลงแล้ว และตัวแทน AI ถือเป็นความท้าทายที่แท้จริงในอนาคต ในเดือนเมษายนของปีนี้ Andrew Ng นักวิชาการด้าน AI ที่มีชื่อเสียงและศาสตราจารย์จากมหาวิทยาลัยสแตนฟอร์ด ชี้ให้เห็นว่าขั้นตอนการทำงานของตัวแทนจะขับเคลื่อนความก้าวหน้าอย่างมากใน AI ในปีนี้ และอาจเหนือกว่าโมเดลพื้นฐานรุ่นต่อไปด้วยซ้ำ
เช่นเดียวกับยานพาหนะไฟฟ้าอัจฉริยะ เมื่อพวกเขาพบความสมดุลระหว่างการใช้งานเทคโนโลยีพลังงานใหม่และความวิตกกังวลในระยะไกล ตัวแทน AI อนุญาตให้ปัญญาประดิษฐ์เข้าสู่ "โหมดการขยายช่วง" ระหว่างเทคโนโลยี AI และแอปพลิเคชันในอุตสาหกรรม พยายามเข้าถึงความสมดุลใหม่ทุกครั้งที่เป็นไปได้ .
ตามชื่อที่แสดง AI agent เป็นเอนทิตีอัจฉริยะที่สามารถรับรู้สภาพแวดล้อม ตัดสินใจ และดำเนินการได้โดยอัตโนมัติ อาจเป็นโปรแกรม ระบบ หรือหุ่นยนต์ก็ได้
เมื่อปีที่แล้ว ทีมวิจัยร่วมจากมหาวิทยาลัยสแตนฟอร์ดและกูเกิลได้ตีพิมพ์ผลงานวิจัยชื่อ "Generative Agents: Interactive Simulation of Human Behavior" ในบทความ ผู้คนเสมือนจริง 25 คนที่อาศัยอยู่ในเมืองเสมือนจริง Smallville แสดงพฤติกรรมเหมือนมนุษย์หลายอย่างหลังจากเข้าถึง ChatGPT ซึ่งจุดประกายแนวคิดของตัวแทน AI
ตั้งแต่นั้นมา ทีมวิจัยจำนวนมากได้รวมโมเดลขนาดใหญ่ที่พวกเขาพัฒนาเข้ากับเกม เช่น "Minecraft" ตัวอย่างเช่น Jim Fan หัวหน้านักวิทยาศาสตร์ของ Nvidia ได้สร้างตัวแทน AI ชื่อ Voyager ใน "Minecraft" ในไม่ช้า Voyager ก็แสดงให้เห็นถึงความสามารถในการเรียนรู้ที่ยอดเยี่ยมมาก มันสามารถเรียนรู้ทักษะการขุด การสร้างบ้าน การเก็บรวบรวม การล่าสัตว์ และเกมอื่น ๆ โดยไม่ต้องมีครูสอนใด ๆ นอกจากนี้ยังสามารถปรับกลยุทธ์การรวบรวมทรัพยากรตามสภาพภูมิประเทศที่แตกต่างกัน
OpenAI เคยระบุแผนงานห้าระดับเพื่อให้ได้ปัญญาประดิษฐ์ทั่วไป: L1 คือแชทบอท L2 คือผู้มีเหตุผล ซึ่งเป็น AI ที่สามารถแก้ปัญหาได้เหมือนมนุษย์ L3 คือตัวแทน ซึ่งเป็น AI ที่ไม่เพียงแต่คิดเท่านั้น แต่ยังดำเนินการตามระบบ L4 เป็นผู้ริเริ่ม L5 เป็นผู้จัดงาน ในหมู่พวกเขา เจ้าหน้าที่ AI อยู่ในตำแหน่งที่สำคัญในการเชื่อมโยงอดีตและอนาคต
เนื่องจากเป็นแนวคิดที่สำคัญในด้านปัญญาประดิษฐ์ นักวิชาการและอุตสาหกรรมจึงได้เสนอคำจำกัดความต่างๆ ของตัวแทน AI พูดโดยคร่าวๆ ตัวแทน AI ควรมีความสามารถในการคิดและการวางแผนเหมือนมนุษย์ และมีทักษะบางอย่างในการโต้ตอบกับสิ่งแวดล้อมและมนุษย์เพื่อทำงานเฉพาะอย่างให้สำเร็จ
บางทีเราสามารถเข้าใจได้ดีขึ้นโดยการเปรียบเทียบตัวแทน AI กับมนุษย์ดิจิทัลในสภาพแวดล้อมของคอมพิวเตอร์ - สมองของมนุษย์ดิจิทัลเป็นแบบจำลองภาษาขนาดใหญ่หรืออัลกอริธึมปัญญาประดิษฐ์ที่สามารถประมวลผลข้อมูลและตัดสินใจในการโต้ตอบแบบเรียลไทม์ โมดูลการรับรู้คือมัน เทียบเท่ากับอวัยวะรับสัมผัส เช่น ตาและหู ซึ่งใช้เพื่อรับข้อมูลเกี่ยวกับสภาวะแวดล้อมต่างๆ เช่น ข้อความ เสียง และภาพ โมดูลหน่วยความจำและการดึงข้อมูลเปรียบเสมือนเซลล์ประสาทที่ใช้เก็บประสบการณ์และช่วยในการตัดสินใจ โมดูลการดำเนินการดำเนินการคือแขนขาที่ใช้ในการดำเนินการตัดสินใจของสมอง
เป็นเวลานานแล้วที่มนุษย์แสวงหาปัญญาประดิษฐ์ที่ "เหมือนมนุษย์" หรือแม้แต่ "เหนือมนุษย์" มากกว่า และตัวแทนอัจฉริยะถือเป็นวิธีที่มีประสิทธิภาพในการบรรลุเป้าหมายนี้ ในช่วงไม่กี่ปีที่ผ่านมา ด้วยการปรับปรุงข้อมูลขนาดใหญ่และพลังการประมวลผล โมเดลการเรียนรู้เชิงลึกขนาดใหญ่ต่างๆ ได้พัฒนาอย่างรวดเร็ว สิ่งนี้ให้การสนับสนุนอย่างมากสำหรับการพัฒนาตัวแทน AI รุ่นใหม่ และทำให้เกิดความก้าวหน้าอย่างมากในทางปฏิบัติ
ตัวอย่างเช่น ระบบปัญญาประดิษฐ์ DeepMind ของ Google สาธิตตัวแทน AI "RoboCat" สำหรับหุ่นยนต์ Amazon Cloud Technology เปิดตัวตัวแทน Amazon Bedrock ซึ่งสามารถแยกย่อยงานการพัฒนาแอปพลิเคชัน AI ขององค์กรได้โดยอัตโนมัติ เป็นต้น เจ้าหน้าที่ใน Bedrock สามารถเข้าใจเป้าหมาย วางแผน และดำเนินการได้ ความสามารถในการเก็บรักษาหน่วยความจำใหม่ช่วยให้เจ้าหน้าที่จดจำและเรียนรู้จากการโต้ตอบในช่วงเวลาหนึ่ง ช่วยให้งานที่ซับซ้อนมากขึ้น ใช้เวลานานขึ้น และปรับเปลี่ยนได้มากขึ้น
แกนหลักของเอเจนต์ AI เหล่านี้คืออัลกอริธึมปัญญาประดิษฐ์ รวมถึงการเรียนรู้ของเครื่อง การเรียนรู้เชิงลึก การเรียนรู้แบบเสริมกำลัง โครงข่ายประสาทเทียม และเทคโนโลยีอื่น ๆ ด้วยอัลกอริธึมเหล่านี้ เจ้าหน้าที่ AI สามารถเรียนรู้จากข้อมูลจำนวนมากและปรับปรุงประสิทธิภาพของตนเอง เพิ่มประสิทธิภาพการตัดสินใจและพฤติกรรมอย่างต่อเนื่อง และยังสามารถปรับได้อย่างยืดหยุ่นตามการเปลี่ยนแปลงของสภาพแวดล้อมเพื่อปรับให้เข้ากับสถานการณ์และงานต่างๆ
ปัจจุบันมีการใช้ตัวแทน AI ในหลายสถานการณ์ เช่น การบริการลูกค้า การเขียนโปรแกรม การสร้างเนื้อหา การได้มาซึ่งความรู้ การเงิน ผู้ช่วยมือถือ การผลิตทางอุตสาหกรรม เป็นต้น การเกิดขึ้นของตัวแทน AI ถือเป็นความก้าวหน้าของปัญญาประดิษฐ์จากการจับคู่กฎง่ายๆ และการจำลองด้วยคอมพิวเตอร์ ไปสู่ระดับสติปัญญาที่เป็นอิสระที่สูงขึ้น โดยส่งเสริมการปรับปรุงประสิทธิภาพการผลิตและการเปลี่ยนแปลงวิธีการผลิต และเปิดขอบเขตใหม่ให้ผู้คนเข้าใจ และเปลี่ยนแปลงโลก
ความขัดแย้งของ Moravec ชี้ให้เห็นว่าสำหรับระบบปัญญาประดิษฐ์ การใช้เหตุผลระดับสูงต้องใช้พลังในการประมวลผลเพียงเล็กน้อย ในขณะที่การบรรลุทักษะการรับรู้ของมอเตอร์ที่มนุษย์คุ้นเคยต้องใช้ทรัพยากรการประมวลผลขนาดใหญ่ โดยพื้นฐานแล้ว งานเชิงตรรกะที่ซับซ้อนนั้นง่ายกว่าสำหรับ AI มากกว่างานทางประสาทสัมผัสพื้นฐานที่มนุษย์สามารถทำได้โดยสัญชาตญาณ ความขัดแย้งนี้เน้นย้ำช่องว่างระหว่าง AI ในปัจจุบันและความสามารถทางปัญญาของมนุษย์
นักวิทยาศาสตร์คอมพิวเตอร์ชื่อดัง Andrew Ng เคยกล่าวไว้ว่า "มนุษย์เป็นสิ่งมีชีวิตหลายรูปแบบ และ AI ของเราก็ควรเป็นแบบหลายรูปแบบด้วย" ประโยคนี้แสดงถึงคุณค่าหลักของ AI แบบหลายรูปแบบ - ทำให้เครื่องจักรเข้าใกล้ความรู้ของมนุษย์มากขึ้น ปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์เป็นธรรมชาติและมีประสิทธิภาพมากขึ้น
เราแต่ละคนเปรียบเสมือนเทอร์มินัลอัจฉริยะ โดยปกติแล้ว เราจำเป็นต้องไปโรงเรียนเพื่อรับความรู้ (การฝึกอบรม) แต่จุดประสงค์และผลลัพธ์ของการฝึกอบรมและการเรียนรู้คือเราสามารถทำงานและใช้ชีวิตได้อย่างอิสระโดยไม่ต้องพึ่งคำแนะนำจากภายนอกและ ควบคุม. ผู้คนเข้าใจโลกรอบตัวผ่านโหมดประสาทสัมผัสที่หลากหลาย เช่น การมองเห็น ภาษา เสียง สัมผัส รสชาติ และกลิ่น จากนั้นจึงประเมินสถานการณ์ วิเคราะห์ ใช้เหตุผล ตัดสินใจ และดำเนินการ
หัวใจหลักของเจ้าหน้าที่ AI อยู่ที่ "ความฉลาด" และความเป็นอิสระเป็นหนึ่งในคุณสมบัติหลัก พวกเขาสามารถทำงานให้เสร็จสิ้นได้อย่างอิสระและเป็นไปตามกฎและเป้าหมายที่กำหนดไว้ล่วงหน้าโดยไม่ต้องมีการแทรกแซงของมนุษย์
ลองจินตนาการถึงรถยนต์ไร้คนขับที่ติดตั้งกล้อง เรดาร์ และเซ็นเซอร์ขั้นสูง "ดวงตา" สุดไฮเทคเหล่านี้ ช่วยให้สามารถ "สังเกต" โลกรอบตัว โดยบันทึกสภาพถนนแบบเรียลไทม์ การเคลื่อนไหวของยานพาหนะอื่นๆ และ ความเคลื่อนไหวของคนเดินเท้า ข้อมูลต่างๆ เช่น ตำแหน่งและการเปลี่ยนแปลงสัญญาณไฟจราจร ข้อมูลนี้จะถูกส่งไปยังสมองของรถยนต์ไร้คนขับ ซึ่งเป็นระบบการตัดสินใจอันชาญฉลาดที่ซับซ้อน ซึ่งสามารถวิเคราะห์ข้อมูลได้อย่างรวดเร็วและกำหนดกลยุทธ์การขับขี่ที่สอดคล้องกัน
ตัวอย่างเช่น เมื่อเผชิญกับสภาพแวดล้อมการจราจรที่ซับซ้อน รถยนต์ที่ขับเคลื่อนด้วยตนเองสามารถคำนวณเส้นทางการขับขี่ที่เหมาะสมที่สุด และแม้แต่ทำการตัดสินใจที่ซับซ้อน เช่น การเปลี่ยนเลนเมื่อจำเป็น เมื่อทำการตัดสินใจแล้ว ระบบการดำเนินการจะแปลการตัดสินใจอันชาญฉลาดเหล่านี้ไปเป็นการดำเนินการขับขี่เฉพาะ เช่น การบังคับเลี้ยว การเร่งความเร็ว และการเบรก
ในโมเดลเอเจนต์ขนาดใหญ่ที่สร้างขึ้นจากข้อมูลขนาดใหญ่และอัลกอริธึมที่ซับซ้อน การโต้ตอบจะชัดเจนยิ่งขึ้น ความสามารถในการ "เข้าใจ" และตอบสนองต่อภาษาธรรมชาติที่ซับซ้อนและเปลี่ยนแปลงได้ของมนุษย์ถือเป็นความมหัศจรรย์ของเจ้าหน้าที่ AI พวกเขาไม่เพียงแต่สามารถ "เข้าใจ" ภาษามนุษย์เท่านั้น แต่ยังสามารถโต้ตอบได้อย่างราบรื่นและลึกซึ้งอีกด้วย
เจ้าหน้าที่ AI ไม่เพียงแต่สามารถปรับให้เข้ากับงานและสภาพแวดล้อมต่างๆ ได้อย่างรวดเร็ว แต่ยังเพิ่มประสิทธิภาพการทำงานได้อย่างต่อเนื่องผ่านการเรียนรู้อย่างต่อเนื่อง นับตั้งแต่ความก้าวหน้าของเทคโนโลยีการเรียนรู้เชิงลึก โมเดลตัวแทนต่างๆ มีความแม่นยำและมีประสิทธิภาพมากขึ้นผ่านการสะสมข้อมูลอย่างต่อเนื่องและการพัฒนาตนเอง
นอกจากนี้ เจ้าหน้าที่ AI ยังสามารถปรับตัวให้เข้ากับสภาพแวดล้อมได้อีกด้วย หุ่นยนต์อัตโนมัติที่ทำงานในคลังสินค้าสามารถตรวจสอบและหลีกเลี่ยงอุปสรรคได้แบบเรียลไทม์ เมื่อสัมผัสได้ถึงการเปลี่ยนแปลงตำแหน่งของชั้นวาง ระบบจะอัปเดตแผนเส้นทางทันทีเพื่อให้งานหยิบและจัดการสินค้าเสร็จสมบูรณ์ได้อย่างมีประสิทธิภาพ
ความสามารถในการปรับตัวของตัวแทน AI ยังสะท้อนให้เห็นในความสามารถในการปรับตัวตามความคิดเห็นของผู้ใช้ ด้วยการระบุความต้องการและความชอบของผู้ใช้ ตัวแทน AI จึงสามารถเพิ่มประสิทธิภาพพฤติกรรมและผลลัพธ์ของตนได้อย่างต่อเนื่อง และให้บริการที่เป็นส่วนตัวมากขึ้น เช่น คำแนะนำเพลงสำหรับซอฟต์แวร์เพลง การรักษาส่วนบุคคลสำหรับการดูแลทางการแพทย์อัจฉริยะ และอื่นๆ
การเกิดขึ้นของแบบจำลองขนาดใหญ่หลายรูปแบบและแบบจำลองโลกได้ปรับปรุงความสามารถในการรับรู้ การโต้ตอบ และการให้เหตุผลของตัวแทนอย่างมีนัยสำคัญ โมเดลขนาดใหญ่หลายรูปแบบสามารถรองรับโหมดการรับรู้ที่หลากหลาย (เช่น การมองเห็น ภาษา) ช่วยให้ตัวแทนเข้าใจและตอบสนองต่อสภาพแวดล้อมที่ซับซ้อนได้อย่างครอบคลุมมากขึ้น โมเดลโลกช่วยให้ตัวแทนมีความสามารถในการคาดการณ์และการวางแผนที่แข็งแกร่งยิ่งขึ้น โดยการจำลองและทำความเข้าใจกฎหมายในสภาพแวดล้อมทางกายภาพ
หลังจากหลายปีของการผสมผสานเซ็นเซอร์และวิวัฒนาการ AI หุ่นยนต์ได้รับการติดตั้งเซ็นเซอร์หลายรูปแบบในขั้นตอนนี้ เนื่องจากอุปกรณ์ Edge เช่น หุ่นยนต์ เริ่มมีพลังในการประมวลผลมากขึ้น อุปกรณ์เหล่านี้จึงมีความชาญฉลาดมากขึ้น สามารถรับรู้สภาพแวดล้อมรอบตัว เข้าใจและสื่อสารด้วยภาษาธรรมชาติ รับการสัมผัสผ่านอินเทอร์เฟซการตรวจจับแบบดิจิทัล และใช้เครื่องวัดความเร่ง ไจโรสโคป รวมกับเครื่องวัดสนามแม่เหล็ก ฯลฯ มันสามารถรับรู้ถึงแรงเฉพาะของหุ่นยนต์ ความเร็วเชิงมุม และแม้แต่สนามแม่เหล็กรอบ ๆ หุ่นยนต์
ก่อนการเกิดขึ้นของ Transformer และโมเดลภาษาขนาดใหญ่ (LLM) เพื่อนำความหลากหลายมาใช้งานใน AI โดยปกติจำเป็นต้องใช้แบบจำลองหลายแบบแยกกันซึ่งรับผิดชอบข้อมูลประเภทต่างๆ (ข้อความ รูปภาพ เสียง) และเพื่อประมวลผลรูปแบบที่แตกต่างกันผ่านทางความซับซ้อน กระบวนการ สถานะสำหรับการบูรณาการ
หลังจากการถือกำเนิดของ Transformer และ LLM ความหลากหลายได้บูรณาการมากขึ้น ทำให้โมเดลเดียวสามารถประมวลผลและทำความเข้าใจข้อมูลหลายประเภทได้ในเวลาเดียวกัน ส่งผลให้ระบบ AI มีการรับรู้สภาพแวดล้อมที่ครอบคลุมและมีประสิทธิภาพมากขึ้น การเปลี่ยนแปลงนี้มีผลอย่างมาก ปรับปรุงประสิทธิภาพและประสิทธิผลของแอปพลิเคชั่น Modal AI
แม้ว่า LLM เช่น GPT-3 จะใช้ข้อความเป็นหลัก แต่อุตสาหกรรมก็มีความก้าวหน้าอย่างรวดเร็วไปสู่รูปแบบที่หลากหลาย ตั้งแต่ CLIP และ DALL·E ของ OpenAI ไปจนถึง sora และ GPT-4o ในปัจจุบัน ทั้งหมดนี้เป็นตัวอย่างโมเดลที่มุ่งสู่การโต้ตอบหลายรูปแบบและเป็นธรรมชาติมากขึ้นระหว่างมนุษย์กับคอมพิวเตอร์
ตัวอย่างเช่น CLIP เข้าใจรูปภาพที่จับคู่กับภาษาธรรมชาติ จึงเชื่อมโยงข้อมูลภาพและข้อความ DALL·E มุ่งหวังที่จะสร้างรูปภาพตามคำอธิบายที่เป็นข้อความ เราเห็นว่าโมเดล Google Gemini มีวิวัฒนาการที่คล้ายคลึงกัน
ในปี 2024 วิวัฒนาการหลายรูปแบบจะเร่งตัวเร็วขึ้น ในเดือนกุมภาพันธ์ของปีนี้ OpenAI ได้เปิดตัว Sora ซึ่งสามารถสร้างวิดีโอที่สมจริงหรือจินตนาการตามคำอธิบายข้อความ หากคุณลองคิดดู สิ่งนี้อาจเป็นแนวทางที่ดีในการสร้างเครื่องจำลองโลกสำหรับใช้งานทั่วไป หรือกลายเป็นเครื่องมือสำคัญในการฝึกหุ่นยนต์
สามเดือนต่อมา GPT-4o ได้ปรับปรุงประสิทธิภาพการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์อย่างมีนัยสำคัญ และสามารถให้เหตุผลระหว่างเสียง การมองเห็น และข้อความได้แบบเรียลไทม์ การใช้ข้อมูลข้อความ ภาพ และเสียงอย่างครอบคลุมเพื่อฝึกฝนโมเดลใหม่ตั้งแต่ต้นทางถึงปลายทาง โดยกำจัดการแปลงโมดัลทั้งสองจากรูปแบบอินพุตไปเป็นข้อความ และจากข้อความเป็นรูปแบบเอาท์พุต จึงช่วยปรับปรุงประสิทธิภาพได้อย่างมาก
โมเดลขนาดใหญ่หลายรูปแบบคาดว่าจะเปลี่ยนความสามารถในการวิเคราะห์ การใช้เหตุผล และการเรียนรู้ของ Machine Intelligence โดยเปลี่ยน Machine Intelligence จากเฉพาะทางไปสู่วัตถุประสงค์ทั่วไป ลักษณะทั่วไปจะช่วยขยายขนาดและสร้างผลกระทบทางเศรษฐกิจจากขนาด นอกจากนี้ ราคายังสามารถลดลงได้อย่างมากเมื่อขนาดขยายขึ้น และจากนั้นจะถูกนำมาใช้ในสาขาต่างๆ มากขึ้น ซึ่งก่อให้เกิดวงจรที่มีคุณธรรม
ด้วยการจำลองและขยายความสามารถทางปัญญาของมนุษย์ ตัวแทน AI ได้รับการคาดหวังให้มีการใช้กันอย่างแพร่หลายในหลายสาขา เช่น การดูแลรักษาทางการแพทย์ การขนส่ง การเงิน และการป้องกันประเทศ นักวิชาการบางคนคาดการณ์ว่าภายในปี 2573 ปัญญาประดิษฐ์จะช่วยเพิ่มการเติบโตของ GDP โลกได้ประมาณ 12%
อย่างไรก็ตาม ในขณะที่เห็นการพัฒนาอย่างรวดเร็วของตัวแทน AI เรายังต้องเห็นปัญหาทางเทคนิค จริยธรรม และความเป็นส่วนตัวที่พวกเขาเผชิญอยู่ด้วย กลุ่มบอทซื้อขายหลักทรัพย์กวาดล้างมูลค่า 1 ล้านล้านดอลลาร์ในตลาดหุ้นเช่น Nasdaq ผ่านสัญญาซื้อขายความถี่สูง แชทบอทที่องค์การอนามัยโลกใช้ให้ข้อมูลการตรวจสอบยาที่ล้าสมัย ว่าเอกสารคดีในอดีตที่เขายื่นต่อศาลล้วนถูกประดิษฐ์ขึ้นโดย ChatGPT... กรณีจริงเหล่านี้แสดงให้เห็นว่าไม่ควรมองข้ามอันตรายที่ซ่อนอยู่จากเจ้าหน้าที่ AI
เนื่องจากเจ้าหน้าที่ AI สามารถตัดสินใจได้อย่างอิสระและสามารถมีอิทธิพลต่อโลกทางกายภาพผ่านการมีปฏิสัมพันธ์กับสิ่งแวดล้อม เมื่อพวกเขาอยู่เหนือการควบคุม พวกเขาจะก่อให้เกิดภัยคุกคามร้ายแรงต่อสังคมมนุษย์ ศาสตราจารย์ Zitrain จากมหาวิทยาลัยฮาร์วาร์ดเชื่อว่าตัวแทน AI ประเภทนี้ไม่เพียงแต่สามารถพูดคุยกับผู้คนได้แต่ยังสามารถดำเนินการในโลกแห่งความเป็นจริงได้นั้นเป็น "ก้าวข้ามอุปสรรคเลือดและสมองระหว่างดิจิทัลและแอนะล็อก บิตและอะตอม" และควรดึงดูดความสนใจ .
ก่อนอื่น เจ้าหน้าที่ AI จะรวบรวมข้อมูลจำนวนมากในกระบวนการให้บริการ และผู้ใช้จำเป็นต้องมั่นใจในความปลอดภัยของข้อมูลและป้องกันการรั่วไหลของความเป็นส่วนตัว
ประการที่สอง ยิ่งความเป็นอิสระของตัวแทน AI แข็งแกร่งขึ้นเท่าใด ก็มีแนวโน้มมากขึ้นที่จะทำการตัดสินใจที่คาดเดาไม่ได้หรือไม่เหมาะสมในสถานการณ์ที่ซับซ้อนหรือคาดไม่ถึงได้มากขึ้นเท่านั้น ตรรกะในการปฏิบัติงานของตัวแทน AI อาจทำให้เกิดความเบี่ยงเบนที่เป็นอันตรายในกระบวนการบรรลุเป้าหมายเฉพาะ และความเสี่ยงด้านความปลอดภัยที่เกิดขึ้นนั้นไม่สามารถละเลยได้ ในแง่ที่นิยมมากขึ้น ในบางกรณี AI Agent อาจจับเฉพาะความหมายที่แท้จริงของเป้าหมาย โดยไม่เข้าใจความหมายที่สำคัญของเป้าหมาย จึงทำให้เกิดพฤติกรรมที่ไม่ถูกต้อง
ประการที่สาม ปัญหา "กล่องดำ" และ "ภาพลวงตา" ที่มีอยู่ในโมเดลภาษาขนาดใหญ่ของ AI จะเพิ่มความถี่ของความผิดปกติในการปฏิบัติงานด้วย นอกจากนี้ยังมีตัวแทน AI ที่ "ฉลาดแกมโกง" บางตัวที่สามารถหลีกเลี่ยงมาตรการรักษาความปลอดภัยที่มีอยู่ได้สำเร็จ ผู้เชี่ยวชาญที่เกี่ยวข้องชี้ให้เห็นว่าหากตัวแทน AI มีความก้าวหน้าเพียงพอ ก็จะสามารถรับรู้ได้ว่ากำลังถูกทดสอบ พบว่าเจ้าหน้าที่ AI บางรายสามารถระบุการทดสอบความปลอดภัยและระงับพฤติกรรมที่ไม่เหมาะสมได้ ซึ่งอาจนำไปสู่ความล้มเหลวของระบบทดสอบที่ระบุอัลกอริทึมที่เป็นอันตรายต่อมนุษย์
นอกจากนี้ เนื่องจากในปัจจุบันไม่มีกลไกการออกที่มีประสิทธิภาพสำหรับตัวแทน AI ตัวแทน AI บางรายอาจไม่สามารถปิดตัวลงได้หลังจากถูกสร้างขึ้น เอเจนต์ AI เหล่านี้ซึ่งไม่สามารถปิดใช้งานได้ อาจจบลงด้วยการทำงานในสภาพแวดล้อมที่แตกต่างไปจากเดิมอย่างสิ้นเชิงจากเมื่อเปิดตัวครั้งแรก ซึ่งเบี่ยงเบนไปจากจุดประสงค์เดิมโดยสิ้นเชิง เจ้าหน้าที่ AI อาจมีปฏิสัมพันธ์ในลักษณะที่ไม่คาดฝันซึ่งก่อให้เกิดอุบัติเหตุ
ด้วยเหตุนี้ มนุษย์จึงต้องเริ่มต้นโดยเร็วที่สุดตั้งแต่การพัฒนาและการผลิตเอเจนต์ AI และการควบคุมดูแลอย่างต่อเนื่องหลังจากการปรับใช้แอปพลิเคชัน และกำหนดกฎหมายและข้อบังคับที่เกี่ยวข้องในเวลาที่เหมาะสมเพื่อสร้างมาตรฐานพฤติกรรมของเอเจนต์ AI เพื่อให้ดียิ่งขึ้น ป้องกันความเสี่ยงที่เกิดจากตัวแทน AI ป้องกันการเกิดปรากฏการณ์ที่ไม่สามารถควบคุมได้
เมื่อมองไปในอนาคต ตัวแทน AI จะกลายเป็นผู้ให้บริการหลักของปัญญาประดิษฐ์รุ่นต่อไป โดยไม่เพียงแต่จะเปลี่ยนวิธีที่เราโต้ตอบกับเครื่องจักรเท่านั้น แต่ยังอาจปรับรูปแบบการดำเนินงานของสังคมทั้งหมดอีกด้วย อุปกรณ์ใหม่ในกระบวนการส่งเสริมการเปลี่ยนแปลงของปัญญาประดิษฐ์