เมื่อเร็วๆ นี้ Tencent ได้เปิดตัวโปรเจ็กต์ชื่อ ELLA ซึ่งเป็นอะแดปเตอร์โมเดลภาษาขนาดใหญ่ที่มีประสิทธิภาพ ซึ่งสามารถปรับปรุงความสามารถของโมเดล SD ที่มีอยู่ในการทำความเข้าใจคำที่พร้อมท์ได้อย่างมาก หากไม่มีการฝึกอบรมเพิ่มเติม ELLA สามารถรวมเข้ากับโมเดลการแพร่กระจายข้อความเป็นรูปภาพ เพื่อปรับปรุงความสามารถของโมเดลในการจัดการการจัดแนวข้อความ แกนหลักของมันอยู่ที่ตัวเชื่อมต่อความหมายที่รับรู้ถึงขั้นตอนเวลา ซึ่งสามารถช่วยให้โมเดลการแพร่กระจายเข้าใจข้อความแจ้งในขั้นตอนต่างๆ ได้ดีขึ้น และด้วยเหตุนี้จึงจัดการกับพร้อมท์ที่ซับซ้อนได้ดีขึ้น เช่น ที่มีหลายอ็อบเจ็กต์และคุณลักษณะที่แตกต่างกัน นวัตกรรมนี้คาดว่าจะนำมาซึ่งความเป็นไปได้ใหม่ๆ ในการพัฒนาโมเดลข้อความเป็นรูปภาพ และปรับปรุงความแม่นยำและประสิทธิภาพของการสร้างภาพ AI ต่อไป
โครงการ ELLA ที่เผยแพร่โดย Tencent แก้ปัญหาความเข้าใจข้อความที่ซับซ้อนไม่เพียงพอโดยโมเดลการแพร่กระจายที่มีอยู่ผ่านตัวเชื่อมต่อความหมายที่รับรู้ขั้นตอนเวลา วิธีการบูรณาการที่สะดวกสบายและผลการทดลองที่ยอดเยี่ยมบ่งชี้ว่า ELLA จะมีบทบาทสำคัญในด้านการสร้างข้อความเป็นภาพ และส่งเสริมความก้าวหน้าทางเทคโนโลยีอย่างต่อเนื่องในสาขานี้ การเกิดขึ้นของ ELLA ทำให้ผู้ใช้ได้รับประสบการณ์การสร้างภาพ AI ที่สะดวกและมีประสิทธิภาพยิ่งขึ้น และยังมอบทิศทางใหม่สำหรับการพัฒนาเทคโนโลยี AI ในอนาคต