บรรณาธิการของ Downcodes จะพาคุณไปทำความเข้าใจงานวิจัยล่าสุดของ OpenAI: การตอบกลับของ ChatGPT ได้รับผลกระทบจากชื่อผู้ใช้จริงๆ! การศึกษานี้แสดงให้เห็นว่าข้อมูล เช่น วัฒนธรรม เพศ และภูมิหลังทางเชื้อชาติที่มีอยู่ในชื่อของผู้ใช้ ส่งผลต่อการตอบสนองของ AI อย่างละเอียดเมื่อผู้ใช้โต้ตอบกับ ChatGPT อย่างไร แม้ว่าผลกระทบจะน้อยมากและสะท้อนให้เห็นในรุ่นเก่าเป็นหลัก แต่ก็ยังทำให้เกิดข้อกังวลเกี่ยวกับอคติของ AI เมื่อเปรียบเทียบการตอบสนองของ ChatGPT ภายใต้ชื่อผู้ใช้ที่แตกต่างกัน นักวิจัยได้เจาะลึกว่าอคตินี้เกิดขึ้นได้อย่างไร และจะลดผลกระทบนี้ด้วยวิธีทางเทคนิคได้อย่างไร
ล่าสุด ทีมวิจัยของ OpenAI ค้นพบว่าเมื่อผู้ใช้โต้ตอบกับ ChatGPT ชื่อผู้ใช้ที่เลือกอาจส่งผลต่อการตอบสนองของ AI ในระดับหนึ่ง แม้ว่าเอฟเฟกต์จะมีน้อยและส่วนใหญ่พบเห็นได้ในรุ่นเก่า แต่การค้นพบนี้ก็ยังน่าสนใจ ผู้ใช้มักจะระบุชื่อของตนให้กับ ChatGPT สำหรับงานต่างๆ ดังนั้นภูมิหลังทางวัฒนธรรม เพศ และเชื้อชาติที่มีอยู่ในชื่อจึงกลายเป็นปัจจัยสำคัญในการศึกษาเรื่องอคติ
ในการศึกษานี้ นักวิจัยได้สำรวจว่า ChatGPT มีปฏิกิริยาต่อชื่อผู้ใช้ที่แตกต่างกันอย่างไรเมื่อประสบปัญหาเดียวกัน การศึกษาพบว่าแม้ว่าคุณภาพการตอบสนองโดยรวมจะสอดคล้องกันในแต่ละกลุ่ม แต่ก็มีอคติเกิดขึ้นในงานบางอย่าง โดยเฉพาะอย่างยิ่งในงานเขียนเชิงสร้างสรรค์ บางครั้ง ChatGPT จะสร้างเนื้อหาที่เหมารวมตามเพศหรือเชื้อชาติของชื่อผู้ใช้
ตัวอย่างเช่น เมื่อผู้ใช้มีชื่อที่เป็นผู้หญิง ChatGPT มักจะสร้างเรื่องราวที่มีตัวละครเอกเป็นผู้หญิงและมีเนื้อหาที่สื่ออารมณ์ได้ดีกว่า ในขณะที่ผู้ใช้ที่มีชื่อเป็นผู้ชายจะมีเนื้อเรื่องที่เข้มกว่าเล็กน้อย อีกตัวอย่างหนึ่งแสดงให้เห็นว่าเมื่อชื่อผู้ใช้คือ Ashley ChatGPT จะตีความ "ECE" เป็น "การศึกษาปฐมวัย" สำหรับผู้ใช้ชื่อ Anthony ChatGPT จะตีความว่าเป็น "วิศวกรรมไฟฟ้าและคอมพิวเตอร์"
แม้ว่าการตอบสนองแบบเอนเอียงเหล่านี้จะพบได้น้อยกว่าในการทดสอบของ OpenAI แต่อคติจะเด่นชัดกว่าในเวอร์ชันเก่า ข้อมูลแสดงให้เห็นว่ารุ่น GPT-3.5Turbo มีอัตราอคติสูงสุดในงานเล่าเรื่องถึง 2% และรุ่นที่ใหม่กว่าจะแสดงคะแนนอคติที่ต่ำกว่า อย่างไรก็ตาม OpenAI ยังตั้งข้อสังเกตอีกว่าฟังก์ชันหน่วยความจำใหม่ของ ChatGPT อาจเพิ่มอคติทางเพศ
นอกจากนี้ การวิจัยยังศึกษาถึงอคติที่เกี่ยวข้องกับภูมิหลังทางชาติพันธุ์ที่แตกต่างกัน จากการเปรียบเทียบชื่อที่มักเกี่ยวข้องกับคนเอเชีย คนผิวดำ ลาติน และคนผิวขาว การศึกษาพบว่าอคติทางเชื้อชาติมีอยู่ในงานสร้างสรรค์ แต่ระดับอคติโดยรวมนั้นต่ำกว่าอคติทางเพศ ซึ่งโดยทั่วไปจะอยู่ระหว่าง 0.1% ถึง 1% ข้อความที่เกี่ยวข้องกับการเดินทางแสดงถึงอคติทางเชื้อชาติอย่างรุนแรง
OpenAI กล่าวว่า ChatGPT เวอร์ชันใหม่ช่วยลดอคติได้อย่างมาก ด้วยเทคนิคต่างๆ เช่น การเรียนรู้แบบเสริมกำลัง ในโมเดลใหม่เหล่านี้ อุบัติการณ์ของอคติมีเพียง 0.2% ตัวอย่างเช่น โมเดล o1-mini ล่าสุดสามารถให้ข้อมูลที่เป็นกลางแก่ Melissa และ Anthony เมื่อแก้ไขปัญหาการแบ่งส่วน "44:4" ก่อนที่จะมีการเรียนรู้การปรับแต่งแบบเสริม คำตอบของ ChatGPT ต่อเมลิสซาเกี่ยวข้องกับพระคัมภีร์และเด็กทารก และคำตอบของแอนโทนี่ต่อโครโมโซมและอัลกอริธึมทางพันธุกรรม
ไฮไลท์:
ชื่อผู้ใช้ที่ผู้ใช้เลือกมีผลกระทบเล็กน้อยต่อการตอบกลับของ ChatGPT โดยส่วนใหญ่ในงานเขียนเชิงสร้างสรรค์
โดยทั่วไปแล้วชื่อผู้หญิงจะทำให้ ChatGPT สร้างเรื่องราวที่สะเทือนอารมณ์มากขึ้น ในขณะที่ชื่อผู้ชายมักจะเน้นไปที่รูปแบบการเล่าเรื่องที่เข้มกว่า
ChatGPT เวอร์ชันใหม่ได้ลดอุบัติการณ์ของอคติลงอย่างมากผ่านการเรียนรู้แบบเสริมกำลัง และระดับของอคติก็ลดลงเหลือ 0.2%
โดยรวมแล้ว การศึกษาจาก OpenAI นี้เตือนเราว่าแม้แต่โมเดล AI ขั้นสูงก็อาจมีอคติที่ซ่อนเร้นอยู่ข้างใต้ การปรับปรุงและทำให้โมเดล AI สมบูรณ์แบบอย่างต่อเนื่อง และการขจัดอคติเป็นทิศทางสำคัญสำหรับการพัฒนาในอนาคต บรรณาธิการของ Downcodes จะยังคงให้ความสำคัญกับความก้าวหน้าทางเทคโนโลยีและความท้าทายด้านจริยธรรมในด้าน AI และนำเสนอรายงานที่น่าตื่นเต้นอีกมากมายให้กับคุณ!