บรรณาธิการของ Downcodes ได้เรียนรู้ว่านักวิจัยได้พัฒนาเทคโนโลยีใหม่ที่เรียกว่า REPA ซึ่งได้รับการออกแบบมาเพื่อปรับปรุงความเร็วการฝึกอบรมและคุณภาพของภาพของโมเดลการสร้างภาพ AI อย่างมีนัยสำคัญ ด้วยการผสานรวมการแสดงภาพคุณภาพสูงจากโมเดลต่างๆ เช่น DINOv2 อย่างชาญฉลาด REPA จึงสามารถปรับปรุงประสิทธิภาพการฝึกอบรมได้อย่างมาก และรับประกันว่าคุณภาพของภาพจะไม่ลดลงแต่เพิ่มขึ้น เทคโนโลยีที่ก้าวล้ำนี้คาดว่าจะส่งเสริมความก้าวหน้าใหม่ในด้านการสร้างภาพ AI
เมื่อเร็วๆ นี้นักวิจัยได้พัฒนาเทคโนโลยีใหม่ที่เรียกว่า REPA ซึ่งมีเป้าหมายเพื่อเร่งการฝึกอบรมโมเดลการสร้างภาพ AI REPA ย่อมาจาก REPresentation Alignment ซึ่งปรับปรุงความเร็วการฝึกอบรมและคุณภาพผลงานโดยการผสานรวมการแสดงภาพคุณภาพสูงจากโมเดล เช่น DINOv2
โมเดลการแพร่กระจายแบบดั้งเดิมมักจะสร้างภาพที่เป็นจุดรบกวน จากนั้นค่อย ๆ ปรับแต่งให้เป็นภาพที่สะอาดตา REPA เพิ่มขั้นตอนในการเปรียบเทียบการเป็นตัวแทนที่สร้างขึ้นในระหว่างกระบวนการลดสัญญาณรบกวนนี้กับการเป็นตัวแทนจาก DINOv2 จากนั้นจะฉายสถานะที่ซ่อนอยู่ของแบบจำลองการแพร่กระจายไปยังตัวแทนของ DINOv2
นักวิจัยกล่าวว่า REPA ไม่เพียงแต่ปรับปรุงประสิทธิภาพการฝึกอบรม แต่ยังปรับปรุงคุณภาพของภาพที่สร้างขึ้นอีกด้วย การทดสอบโดยใช้สถาปัตยกรรมโมเดลการแพร่กระจายต่างๆ แสดงให้เห็นการปรับปรุงที่สำคัญ: 1. เวลาการฝึกอบรมลดลงสูงสุด 17.5 เท่า 2. คุณภาพของภาพที่ส่งออกไม่มีการสูญเสีย 3. ประสิทธิภาพที่ดีขึ้นในเมตริกคุณภาพของภาพมาตรฐาน
ตัวอย่างเช่น โมเดล SiT-XL ที่ใช้ REPA บรรลุสิ่งที่รุ่นดั้งเดิมต้องการ 7 ล้านขั้นตอนด้วยขั้นตอนการฝึกเพียง 400,000 ขั้นตอน นักวิจัยเชื่อว่านี่เป็นก้าวสำคัญสู่ระบบการสร้างภาพ AI ที่ทรงพลังและมีประสิทธิภาพยิ่งขึ้น
การเกิดขึ้นของเทคโนโลยี REPA นำมาซึ่งความหวังใหม่สำหรับความเร็วการฝึกอบรมและคุณภาพเอาต์พุตของโมเดลการสร้างภาพ AI เนื่องจากเทคโนโลยีนี้ได้รับการพัฒนาและนำไปใช้เพิ่มเติม เราจึงสามารถคาดหวังที่จะเห็นนวัตกรรมและความก้าวหน้าใหม่ๆ มากขึ้น
การเกิดขึ้นของเทคโนโลยี REPA ได้นำความเป็นไปได้ใหม่ๆ มาสู่ด้านการสร้างภาพ AI อนาคต.