การศึกษาใหม่จากมหาวิทยาลัยแคลิฟอร์เนีย เบิร์กลีย์ เผยให้เห็นผลกระทบของการปรับเปลี่ยนคำใบ้อัตโนมัติของโมเดลภาษาขนาดใหญ่ (LLM) บนเครื่องมือสร้างภาพ DALL-E3 ทีมวิจัยได้เปรียบเทียบประสิทธิภาพของ DALL-E2, DALL-E3 และ DALL-E3 ที่ดัดแปลงโดยใช้การแจ้งอัตโนมัติในการสร้างภาพผ่านการทดลองออนไลน์ที่มีผู้เข้าร่วม 1,891 คน และทำการวิเคราะห์เชิงลึกเกี่ยวกับผลกระทบของการแก้ไขการแจ้งอัตโนมัติต่อ คุณภาพของภาพและผลกระทบต่อประสบการณ์ผู้ใช้ ผลการทดลองนั้นน่าประหลาดใจและให้มุมมองใหม่สำหรับการใช้เครื่องมือ AI
เมื่อเร็วๆ นี้ การศึกษาจากมหาวิทยาลัยแคลิฟอร์เนีย เบิร์กลีย์ แสดงให้เห็นว่าการปรับเปลี่ยนคิวอัตโนมัติด้วยโมเดลภาษาขนาดใหญ่ (LLM) สามารถลดคุณภาพของภาพที่สร้างโดย DALL-E3 ได้อย่างมาก การศึกษานี้ได้ทำการทดลองออนไลน์กับผู้เข้าร่วม 1,891 คน เพื่อสำรวจผลกระทบของการเขียนใหม่อัตโนมัติต่อคุณภาพของภาพ
ในการทดลอง ผู้เข้าร่วมได้รับการสุ่มแบ่งออกเป็นสามกลุ่ม: DALL-E2, DALL-E3 และ DALL-E3 พร้อมการแก้ไขอัตโนมัติ ผู้เข้าร่วมจะต้องเขียนข้อความเตือน 10 ข้อความติดต่อกันเพื่อสร้างภาพเป้าหมายที่แม่นยำที่สุด ผลลัพธ์แสดงให้เห็นว่า DALL-E3 ดีกว่า DALL-E2 ในการสร้างภาพ และระดับการจับคู่ระหว่างภาพที่สร้างขึ้นกับเป้าหมายได้รับการปรับปรุงอย่างมาก อย่างไรก็ตาม เมื่อใช้พร้อมท์ที่แก้ไขโดยอัตโนมัติ ประสิทธิภาพของ DALL-E3 ลดลงเกือบ 58% แม้ว่าผู้ใช้ DALL-E3 ที่ใช้การเขียนพร้อมท์ใหม่ยังคงมีประสิทธิภาพเหนือกว่าผู้ใช้ DALL-E2 แต่ข้อดีนี้ก็ลดลงอย่างมาก
นักวิจัยพบว่าช่องว่างด้านประสิทธิภาพระหว่าง DALL-E3 และ DALL-E2 สาเหตุหลักมาจากสองปัจจัย ประการแรกคือการปรับปรุงความสามารถด้านเทคนิคของ DALL-E3 และอีกประการคือความสามารถในการปรับตัวของผู้ใช้ในการกระตุ้นกลยุทธ์ โดยเฉพาะอย่างยิ่ง ผู้ใช้ DALL-E3 ใช้ข้อความแจ้งที่ยาวกว่า มีความหมายคล้ายกันมากกว่า และใช้คำที่สื่อความหมายมากกว่า ผู้เข้าร่วมไม่ทราบว่าตนใช้โมเดลใด แต่ประสิทธิภาพแสดงให้เห็นถึงความสามารถในการปรับตัวนี้
นักวิจัยเชื่อว่าในขณะที่โมเดลต่างๆ มีการปรับปรุงอย่างต่อเนื่อง ผู้ใช้จะยังคงปรับคำแนะนำของตนต่อไปเพื่อใช้ประโยชน์จากความสามารถของโมเดลล่าสุดได้ดียิ่งขึ้น นี่แสดงให้เห็นว่าแม้ว่าการเกิดขึ้นของโมเดลใหม่จะไม่ทำให้การแจ้งล้าสมัย แต่การแจ้งยังคงเป็นวิธีสำคัญสำหรับผู้ใช้ในการสำรวจศักยภาพของโมเดลใหม่
การศึกษานี้เตือนเราว่าเครื่องมืออัตโนมัติไม่ได้ช่วยให้ผู้ใช้ปรับปรุงประสิทธิภาพเสมอไป และอาจจำกัดพวกเขาจากการบรรลุศักยภาพสูงสุดของโมเดลแทน ดังนั้น เมื่อใช้เครื่องมือ AI ผู้ใช้ควรพิจารณาวิธีการปรับสัญญาณอย่างมีประสิทธิภาพสูงสุดเพื่อให้ได้การสร้างภาพที่เหมาะสมที่สุด
ไฮไลท์:
การแก้ไขพร้อมท์อัตโนมัติทำให้คุณภาพของภาพ DALL-E3 ลดลงเกือบ 58% ซึ่งเป็นการจำกัดประสิทธิภาพของผู้ใช้
การทดลองพบว่าแม้ว่า DALL-E3 จะดีกว่า DALL-E2 แต่ผลกระทบก็ลดลงหลังจากแก้ไขข้อความแจ้งโดยอัตโนมัติ
ผู้ใช้จำเป็นต้องปรับกลยุทธ์การกระตุ้นตามความคืบหน้าของโมเดลเพื่อให้ตระหนักถึงศักยภาพของโมเดลใหม่อย่างเต็มที่
โดยรวมแล้ว การศึกษานี้เน้นย้ำความคิดริเริ่มของผู้ใช้และความสามารถในการปรับตัวในการใช้เครื่องมือ AI โดยเตือนเราว่าเราไม่สามารถพึ่งพาเครื่องมืออัตโนมัติแบบสุ่มสี่สุ่มห้าได้ แต่ควรสำรวจวิธีการโต้ตอบที่ดีที่สุดอย่างจริงจังเพื่อตระหนักถึงศักยภาพของโมเดล AI อย่างเต็มที่และรับ สร้างภาพที่ดีที่สุด สิ่งนี้มีความสำคัญเป็นแนวทางที่สำคัญสำหรับการพัฒนาและการใช้เครื่องมือ AI ในอนาคต