เมื่อเร็วๆ นี้ ทีมวิจัยจากมหาวิทยาลัยนิวยอร์ก เอ็มไอที และกูเกิลได้ตีพิมพ์ผลการศึกษาที่ก้าวหน้า โดยเสนอกรอบการทำงานที่เป็นนวัตกรรมใหม่ที่ออกแบบมาเพื่อแก้ปัญหาคอขวดของเวลาอนุมานของโมเดลการแพร่กระจาย เฟรมเวิร์กนี้ผสมผสานความคิดเห็นของผู้ตรวจสอบความถูกต้องและอัลกอริธึมการค้นหาผู้สมัครที่มีสัญญาณรบกวนอย่างชาญฉลาด เพื่อปรับปรุงประสิทธิภาพของโมเดลเชิงกำเนิดอย่างมีนัยสำคัญ โดยการแนะนำทรัพยากรการประมวลผลเพิ่มเติม ในขณะที่ยังคงรักษาขั้นตอนการลดสัญญาณรบกวนในจำนวนคงที่ งานวิจัยนี้ไม่เพียงแต่บรรลุผลลัพธ์ที่ยอดเยี่ยมในการทดสอบเกณฑ์มาตรฐานหลายรายการเท่านั้น แต่ยังเป็นข้อมูลอ้างอิงที่มีคุณค่าสำหรับการพัฒนาระบบการตรวจสอบเฉพาะทางในอนาคตสำหรับงานสร้างภาพอีกด้วย
กรอบการทำงานส่วนใหญ่ถูกนำมาใช้โดยการแนะนำเครื่องมือตรวจสอบความถูกต้องเพื่อให้ข้อเสนอแนะ และใช้อัลกอริธึมเพื่อค้นหาตัวเลือกสัญญาณรบกวนที่ดีกว่า ทีมวิจัยใช้ Inception Score และ Fréchet Inception Distance เป็นตัวตรวจสอบ และทำการทดลองโดยใช้โมเดล SiT-XL ที่ผ่านการฝึกอบรมมาแล้ว ผลการทดลองแสดงให้เห็นว่าวิธีการนี้ปรับปรุงคุณภาพตัวอย่างได้อย่างมีประสิทธิภาพ โดยเฉพาะอย่างยิ่งการบรรลุความก้าวหน้าที่สำคัญใน ImageReward และ Verifier Ensemble
ผลการทดลองแสดงให้เห็นว่ากรอบงานทำงานได้ดีกับการวัดประสิทธิภาพหลายรายการ ในการทดสอบ DrawBench การประเมิน LLM Grader ยืนยันว่าวิธีการยืนยันการค้นหาสามารถปรับปรุงคุณภาพตัวอย่างได้อย่างต่อเนื่อง โดยเฉพาะอย่างยิ่ง ImageReward และ Verifier Ensemble ได้รับการปรับปรุงที่สำคัญในหน่วยวัดต่างๆ เนื่องจากความสามารถในการประเมินที่แม่นยำและความสอดคล้องกับความต้องการของมนุษย์ในระดับสูง
การศึกษานี้ไม่เพียงแต่ยืนยันประสิทธิผลของวิธีการขยายการคำนวณตามการค้นหาเท่านั้น แต่ยังเผยให้เห็นถึงอคติโดยธรรมชาติของเครื่องมือตรวจสอบต่างๆ ซึ่งชี้ให้เห็นถึงแนวทางสำหรับการพัฒนาระบบการตรวจสอบเฉพาะทางในอนาคตสำหรับงานสร้างภาพ การค้นพบนี้มีความสำคัญอย่างยิ่งในการปรับปรุงประสิทธิภาพโดยรวมของโมเดลการสร้าง AI
งานวิจัยนี้ให้แนวคิดใหม่ๆ ในการปรับปรุงประสิทธิภาพการใช้เหตุผลของแบบจำลองการแพร่กระจาย กรอบการทำงานและวิธีการที่นำเสนอนั้นคุ้มค่าแก่การวิจัยและการประยุกต์ใช้เพิ่มเติม โดยให้ค่าอ้างอิงที่สำคัญสำหรับการพัฒนาแบบจำลองการสร้าง AI ในอนาคต และยังเป็นการป่าวประกาศถึงประสิทธิภาพและคุณภาพที่สูงขึ้นอีกด้วย เทคโนโลยีการสร้างภาพ AI กำลังมา