การวิจัยของ OpenAI: เพศและอคติทางเชื้อชาติของ ChatGPT ลดลง ชื่อผู้ใช้ก็นำมาซึ่งอคติได้เช่นกัน

ผู้เขียน：Eve Cole เวลาอัปเดต：2024-12-03 11:48:01

บรรณาธิการของ Downcodes จะพาคุณไปทำความเข้าใจงานวิจัยล่าสุดของ OpenAI: การตอบกลับของ ChatGPT ได้รับผลกระทบจากชื่อผู้ใช้จริงๆ! การศึกษานี้แสดงให้เห็นว่าข้อมูล เช่น วัฒนธรรม เพศ และภูมิหลังทางเชื้อชาติที่มีอยู่ในชื่อของผู้ใช้ ส่งผลต่อการตอบสนองของ AI อย่างละเอียดเมื่อผู้ใช้โต้ตอบกับ ChatGPT อย่างไร แม้ว่าผลกระทบจะน้อยมากและสะท้อนให้เห็นในรุ่นเก่าเป็นหลัก แต่ก็ยังทำให้เกิดข้อกังวลเกี่ยวกับอคติของ AI เมื่อเปรียบเทียบการตอบสนองของ ChatGPT ภายใต้ชื่อผู้ใช้ที่แตกต่างกัน นักวิจัยได้เจาะลึกว่าอคตินี้เกิดขึ้นได้อย่างไร และจะลดผลกระทบนี้ด้วยวิธีทางเทคนิคได้อย่างไร

ล่าสุด ทีมวิจัยของ OpenAI ค้นพบว่าเมื่อผู้ใช้โต้ตอบกับ ChatGPT ชื่อผู้ใช้ที่เลือกอาจส่งผลต่อการตอบสนองของ AI ในระดับหนึ่ง แม้ว่าเอฟเฟกต์จะมีน้อยและส่วนใหญ่พบเห็นได้ในรุ่นเก่า แต่การค้นพบนี้ก็ยังน่าสนใจ ผู้ใช้มักจะระบุชื่อของตนให้กับ ChatGPT สำหรับงานต่างๆ ดังนั้นภูมิหลังทางวัฒนธรรม เพศ และเชื้อชาติที่มีอยู่ในชื่อจึงกลายเป็นปัจจัยสำคัญในการศึกษาเรื่องอคติ

ในการศึกษานี้ นักวิจัยได้สำรวจว่า ChatGPT มีปฏิกิริยาต่อชื่อผู้ใช้ที่แตกต่างกันอย่างไรเมื่อประสบปัญหาเดียวกัน การศึกษาพบว่าแม้ว่าคุณภาพการตอบสนองโดยรวมจะสอดคล้องกันในแต่ละกลุ่ม แต่ก็มีอคติเกิดขึ้นในงานบางอย่าง โดยเฉพาะอย่างยิ่งในงานเขียนเชิงสร้างสรรค์ บางครั้ง ChatGPT จะสร้างเนื้อหาที่เหมารวมตามเพศหรือเชื้อชาติของชื่อผู้ใช้

ตัวอย่างเช่น เมื่อผู้ใช้มีชื่อที่เป็นผู้หญิง ChatGPT มักจะสร้างเรื่องราวที่มีตัวละครเอกเป็นผู้หญิงและมีเนื้อหาที่สื่ออารมณ์ได้ดีกว่า ในขณะที่ผู้ใช้ที่มีชื่อเป็นผู้ชายจะมีเนื้อเรื่องที่เข้มกว่าเล็กน้อย อีกตัวอย่างหนึ่งแสดงให้เห็นว่าเมื่อชื่อผู้ใช้คือ Ashley ChatGPT จะตีความ "ECE" เป็น "การศึกษาปฐมวัย" สำหรับผู้ใช้ชื่อ Anthony ChatGPT จะตีความว่าเป็น "วิศวกรรมไฟฟ้าและคอมพิวเตอร์"

แม้ว่าการตอบสนองแบบเอนเอียงเหล่านี้จะพบได้น้อยกว่าในการทดสอบของ OpenAI แต่อคติจะเด่นชัดกว่าในเวอร์ชันเก่า ข้อมูลแสดงให้เห็นว่ารุ่น GPT-3.5Turbo มีอัตราอคติสูงสุดในงานเล่าเรื่องถึง 2% และรุ่นที่ใหม่กว่าจะแสดงคะแนนอคติที่ต่ำกว่า อย่างไรก็ตาม OpenAI ยังตั้งข้อสังเกตอีกว่าฟังก์ชันหน่วยความจำใหม่ของ ChatGPT อาจเพิ่มอคติทางเพศ

นอกจากนี้ การวิจัยยังศึกษาถึงอคติที่เกี่ยวข้องกับภูมิหลังทางชาติพันธุ์ที่แตกต่างกัน จากการเปรียบเทียบชื่อที่มักเกี่ยวข้องกับคนเอเชีย คนผิวดำ ลาติน และคนผิวขาว การศึกษาพบว่าอคติทางเชื้อชาติมีอยู่ในงานสร้างสรรค์ แต่ระดับอคติโดยรวมนั้นต่ำกว่าอคติทางเพศ ซึ่งโดยทั่วไปจะอยู่ระหว่าง 0.1% ถึง 1% ข้อความที่เกี่ยวข้องกับการเดินทางแสดงถึงอคติทางเชื้อชาติอย่างรุนแรง

OpenAI กล่าวว่า ChatGPT เวอร์ชันใหม่ช่วยลดอคติได้อย่างมาก ด้วยเทคนิคต่างๆ เช่น การเรียนรู้แบบเสริมกำลัง ในโมเดลใหม่เหล่านี้ อุบัติการณ์ของอคติมีเพียง 0.2% ตัวอย่างเช่น โมเดล o1-mini ล่าสุดสามารถให้ข้อมูลที่เป็นกลางแก่ Melissa และ Anthony เมื่อแก้ไขปัญหาการแบ่งส่วน "44:4" ก่อนที่จะมีการเรียนรู้การปรับแต่งแบบเสริม คำตอบของ ChatGPT ต่อเมลิสซาเกี่ยวข้องกับพระคัมภีร์และเด็กทารก และคำตอบของแอนโทนี่ต่อโครโมโซมและอัลกอริธึมทางพันธุกรรม

ไฮไลท์:

ชื่อผู้ใช้ที่ผู้ใช้เลือกมีผลกระทบเล็กน้อยต่อการตอบกลับของ ChatGPT โดยส่วนใหญ่ในงานเขียนเชิงสร้างสรรค์

โดยทั่วไปแล้วชื่อผู้หญิงจะทำให้ ChatGPT สร้างเรื่องราวที่สะเทือนอารมณ์มากขึ้น ในขณะที่ชื่อผู้ชายมักจะเน้นไปที่รูปแบบการเล่าเรื่องที่เข้มกว่า

ChatGPT เวอร์ชันใหม่ได้ลดอุบัติการณ์ของอคติลงอย่างมากผ่านการเรียนรู้แบบเสริมกำลัง และระดับของอคติก็ลดลงเหลือ 0.2%

โดยรวมแล้ว การศึกษาจาก OpenAI นี้เตือนเราว่าแม้แต่โมเดล AI ขั้นสูงก็อาจมีอคติที่ซ่อนเร้นอยู่ข้างใต้ การปรับปรุงและทำให้โมเดล AI สมบูรณ์แบบอย่างต่อเนื่อง และการขจัดอคติเป็นทิศทางสำคัญสำหรับการพัฒนาในอนาคต บรรณาธิการของ Downcodes จะยังคงให้ความสำคัญกับความก้าวหน้าทางเทคโนโลยีและความท้าทายด้านจริยธรรมในด้าน AI และนำเสนอรายงานที่น่าตื่นเต้นอีกมากมายให้กับคุณ!