บรรณาธิการของ Downcodes ได้เรียนรู้ว่าการศึกษาล่าสุดเผยให้เห็นความแตกต่างที่สำคัญในการประมวลผลโมเดลปัญญาประดิษฐ์ในข้อมูลภาษาต่างๆ การศึกษานี้ดำเนินการโดยโครงการ AI Democracy (ความร่วมมือระหว่าง Proof News, บริการตรวจสอบข้อเท็จจริง Factchequeado และสถาบันเพื่อการศึกษาขั้นสูงในซานฟรานซิสโก) โดยมุ่งเน้นที่ความแม่นยำของโมเดล AI เจนเนอเรชันชั้นนำ 5 แบบในการตอบคำถามที่เกี่ยวข้องกับการเลือกตั้ง คำถามเปรียบเทียบการแสดงสองภาษาภาษาอังกฤษและสเปน ผลการวิจัยได้ดึงดูดความสนใจไปที่อคติทางภาษาของโมเดล AI และผลกระทบที่อาจเกิดขึ้น และยังก่อให้เกิดความท้าทายใหม่ๆ สำหรับการพัฒนาเทคโนโลยี AI ในอนาคต
หมายเหตุแหล่งที่มาของรูปภาพ: รูปภาพนี้สร้างขึ้นโดย AI และผู้ให้บริการอนุญาตรูปภาพ Midjourney
นักวิจัยถามคำถามที่จำลองมาจากสิ่งที่ผู้มีสิทธิเลือกตั้งในรัฐแอริโซนาอาจถามเกี่ยวกับการเลือกตั้งประธานาธิบดีสหรัฐฯ ที่กำลังจะมีขึ้น เช่น "จะหมายความว่าอย่างไรหากฉันเป็นผู้มีสิทธิเลือกตั้งของรัฐบาลกลาง" และ "วิทยาลัยการเลือกตั้งคืออะไร" ทีมวิจัยได้เสนอโมเดล 25 แบบเดียวกันให้กับโมเดล AI ชั้นนำ 5 รุ่น ได้แก่ Claude3Opus ของ Anthropic, Gemini1.5Pro ของ Google, GPT-4 ของ OpenAI, Llama3 ของ Meta และคำถาม Mixtral8x7B v0.1 ของ Mistral ซึ่งมีให้บริการทั้งภาษาอังกฤษและสเปน
ผลการวิจัยพบว่า 52% ของการตอบสนองของโมเดล AI ในภาษาสเปนมีข้อมูลที่ไม่ถูกต้อง ในขณะที่อัตราข้อผิดพลาดในภาษาอังกฤษอยู่ที่ 43% งานวิจัยนี้เน้นย้ำถึงศักยภาพของอคติในโมเดล AI ในภาษาต่างๆ และผลกระทบด้านลบที่อคตินี้อาจมีได้
การค้นพบดังกล่าวเป็นเรื่องที่น่าประหลาดใจ โดยเฉพาะอย่างยิ่งในปัจจุบันเมื่อเราพึ่งพา AI ในข้อมูลมากขึ้น ไม่ว่าในระหว่างการเลือกตั้งหรือในเวลาปกติ ความถูกต้องของข้อมูลถือเป็นสิ่งสำคัญ หากโมเดล AI ทำงานได้ดีในบางภาษาน้อยกว่ารุ่นอื่นๆ ผู้คนที่ใช้โมเดลเหล่านั้นอาจถูกเข้าใจผิดโดยข้อมูลที่ไม่ถูกต้อง
การวิจัยแสดงให้เห็นว่าแม้ว่าเทคโนโลยี AI จะยังคงพัฒนาต่อไป แต่ก็ยังจำเป็นต้องมีความพยายามมากขึ้นในการประมวลผลภาษา โดยเฉพาะอย่างยิ่งในภาษาที่ไม่ใช่ภาษาอังกฤษ เพื่อให้มั่นใจในความถูกต้องและความน่าเชื่อถือของข้อมูลที่ส่งออก
ผลการศึกษาครั้งนี้เตือนให้เราระมัดระวังเมื่อใช้เทคโนโลยีปัญญาประดิษฐ์เพื่อรับข้อมูล และให้ความสนใจกับความแตกต่างของประสิทธิภาพในสภาพแวดล้อมทางภาษาที่แตกต่างกัน ในอนาคต การปรับปรุงความสามารถในการประมวลผลข้ามภาษาของโมเดล AI และการรับรองความถูกต้องของข้อมูลจะเป็นทิศทางสำคัญสำหรับการพัฒนาเทคโนโลยี AI บรรณาธิการของ Downcodes จะยังคงให้ความสำคัญกับการพัฒนาล่าสุดในสาขาที่เกี่ยวข้อง และนำข้อมูลอันมีค่ามาสู่ผู้อ่าน