แชทบอท AI เหนือกว่ามนุษย์ในการทดสอบการตัดสินทางสังคม และอาจกลายเป็นที่ปรึกษาด้านปฏิสัมพันธ์ทางสังคม

ผู้เขียน：Eve Cole เวลาอัปเดต：2024-12-18 09:21:14

การศึกษาล่าสุดที่ตีพิมพ์ในรายงานทางวิทยาศาสตร์ได้ดึงดูดความสนใจ ซึ่งแสดงให้เห็นว่าแชทบอท AI ขั้นสูงบางตัวมีความสามารถเหนือกว่ามนุษย์ในการประเมินสถานการณ์ทางสังคมที่ซับซ้อน นักวิจัยเปรียบเทียบแชทบอท AI หลายตัวกับผู้เข้าร่วมผ่านการทดสอบการตัดสินตามสถานการณ์ ผลการวิจัยพบว่า AI บางตัวทำงานได้ดีขึ้นในการเลือกการตอบสนองทางพฤติกรรมที่ดีที่สุด ซึ่งให้ข้อมูลเชิงลึกใหม่ๆ เกี่ยวกับการประยุกต์ใช้ AI ในการบริการลูกค้า การสนับสนุนด้านสุขภาพจิต และสาขาอื่นๆ ความเป็นไปได้ใหม่ การวิจัยยังไม่สมบูรณ์แบบ และจำเป็นต้องมีการสำรวจเพิ่มเติมเพื่อทำความเข้าใจว่า AI ดำเนินการอย่างไรในการโต้ตอบทางสังคมที่แท้จริง และวิธีเอาชนะข้อจำกัดของการขาดอารมณ์ที่แท้จริง

เมื่อเร็วๆ นี้ การศึกษาที่ตีพิมพ์ในรายงานทางวิทยาศาสตร์แสดงให้เห็นว่าแชทบอท AI ขั้นสูงบางตัวสามารถทำงานได้ดีกว่ามนุษย์ในการประเมินสถานการณ์ทางสังคมที่ซับซ้อน

การใช้เครื่องมือทางจิตวิทยาที่ใช้กันอย่างแพร่หลายที่เรียกว่า Situational Judgement Test นักวิจัยพบว่าแชทบอท 3 ตัว ได้แก่ Claude, Microsoft Co-pilot และผู้ช่วยอัจฉริยะของ you.com มีประสิทธิภาพเหนือกว่ามนุษย์ในการเลือกการตอบสนองทางพฤติกรรมที่มีประสิทธิภาพสูงสุด

AI机器人写论文

หมายเหตุแหล่งที่มาของรูปภาพ: รูปภาพนี้สร้างขึ้นโดย AI และผู้ให้บริการอนุญาตรูปภาพ Midjourney

เมื่อปฏิสัมพันธ์ทางสังคมมีความสำคัญมากขึ้น ศักยภาพของ AI ในการปฏิสัมพันธ์ทางสังคมยังคงปรากฏให้เห็นอย่างต่อเนื่อง รวมถึงการใช้งานในด้านต่าง ๆ เช่น การบริการลูกค้า และการสนับสนุนด้านสุขภาพจิต โมเดลภาษาขนาดใหญ่ เช่น แชทบอทที่ทดสอบในการศึกษานี้ สามารถประมวลผลภาษา ทำความเข้าใจบริบท และให้การตอบสนองที่มีประสิทธิภาพ แม้ว่าการวิจัยก่อนหน้านี้ได้แสดงให้เห็นถึงความสามารถของแบบจำลองเหล่านี้ในด้านการใช้เหตุผลเชิงวิชาการและงานด้านภาษา แต่ประสิทธิผลของแบบจำลองเหล่านี้ในพลวัตทางสังคมที่ซับซ้อนยังคงไม่ได้รับการสำรวจ

ทีมวิจัยได้ทดสอบผู้เข้าร่วม 276 คน ซึ่งเป็นผู้สมัครโครงการนำร่องที่มีคุณสมบัติสูง การศึกษานี้ใช้การทดสอบการตัดสินตามสถานการณ์ที่นำเสนอสถานการณ์ 12 สถานการณ์ที่ต้องประเมิน โดยแต่ละสถานการณ์มีทางเลือกด้านพฤติกรรมที่เป็นไปได้ 4 ทาง นักวิจัยเปรียบเทียบประสิทธิภาพของแชทบอท AI ห้าตัว และพบว่าแชทบอทที่ทดสอบทั้งหมดทำงานได้ดีพอๆ กับมนุษย์ และบางแชทบอทก็ทำงานได้ดีกว่าด้วยซ้ำ Claude ทำงานได้ดีที่สุด ตามมาด้วยโปรแกรมนำร่องของ Microsoft Co และผู้ช่วยอัจฉริยะของ you.com

สิ่งที่น่าสนใจคือเมื่อแชทบอทไม่ได้เลือกการตอบสนองที่ดีที่สุด พวกเขามักจะเลือกตัวเลือกที่มีประสิทธิภาพมากที่สุดเป็นอันดับสอง ซึ่งแสดงให้เห็นถึงความคล้ายคลึงกับรูปแบบการตัดสินใจของมนุษย์ นี่แสดงให้เห็นว่าแม้ว่าระบบ AI จะไม่สมบูรณ์แบบ แต่ก็มีความสามารถบางอย่างในการตัดสินทางสังคมและการให้เหตุผลตามความน่าจะเป็น

นอกจากนี้ การวิจัยยังพบความแตกต่างในความน่าเชื่อถือระหว่างระบบ AI ต่างๆ Claude แสดงความสอดคล้องสูงสุดในการทดสอบหลายรายการ ในขณะที่ Google Gemini อาจมีคะแนนที่ขัดแย้งกันในการทดสอบต่างๆ อย่างไรก็ตาม ประสิทธิภาพโดยรวมของระบบ AI ทั้งหมดเกินความคาดหมาย ซึ่งแสดงให้เห็นถึงศักยภาพในการให้คำแนะนำด้านความสามารถทางสังคม

นักวิจัยตั้งข้อสังเกตว่าในขณะที่ผู้คนจำนวนมากใช้แชทบอทในงานประจำวันอยู่แล้ว ประสิทธิภาพของพวกเขาในสถานการณ์ที่ซับซ้อนของการโต้ตอบทางสังคมยังคงต้องการการตรวจสอบเพิ่มเติม การวิจัยแสดงให้เห็นว่าแบบจำลองภาษาขนาดใหญ่ทำงานได้ดีในสถานการณ์ทางสังคมจำลอง แต่ไม่มีอารมณ์ที่แท้จริงที่จำเป็นสำหรับพฤติกรรมทางสังคมที่แท้จริง

โดยรวมแล้ว งานวิจัยนี้เผยให้เห็นถึงศักยภาพมหาศาลของ AI ในด้านสังคม แต่ยังเตือนเราด้วยว่าเราต้องระมัดระวังในการใช้ AI ในสถานการณ์ทางสังคมจริง และจำเป็นต้องมีการวิจัยเพิ่มเติมเกี่ยวกับความเข้าใจทางอารมณ์ของ AI และสังคมที่แท้จริง ความสามารถ