สถาบันวิจัยปัญญาประดิษฐ์ Beijing Zhiyuan (BAAI) ได้เปิดตัวโมเดลการสร้างภาพรอบด้านใหม่ OmniGen ซึ่งสร้างความก้าวหน้าครั้งสำคัญในด้านการสร้างภาพ ด้วยความสามารถในการถ่ายทอดความรู้ที่เป็นเอกภาพ ความเรียบง่าย และข้ามงาน OmniGen สามารถจัดการงานการสร้างภาพที่หลากหลายได้อย่างมีประสิทธิภาพภายในกรอบงานเดียว รวมถึงการสร้างภาพ การแก้ไขภาพ การสร้างตามหัวข้อ และการสร้างสภาพภาพ ซึ่งสามารถทำได้แม้กระทั่งทำให้เสร็จสมบูรณ์ การลบภาพ งานคอมพิวเตอร์วิทัศน์แบบคลาสสิก เช่น การตรวจจับสัญญาณรบกวนและขอบ เครื่องมือแก้ไข Downcodes จะอธิบายรายละเอียดเกี่ยวกับฟังก์ชันอันทรงพลังและการทำงานที่สะดวกสบายของ OmniGen
เมื่อเร็วๆ นี้ สถาบันวิจัยปัญญาประดิษฐ์ Beijing Zhiyuan (BAAI) ได้ประกาศเปิดตัว OmniGen โมเดลการสร้างภาพรอบด้านใหม่ ซึ่งถือเป็นความก้าวหน้าครั้งสำคัญในด้านการสร้างภาพ โมเดล OmniGen เป็นที่รู้จักในด้านความเป็นเอกภาพ ความเรียบง่าย และความสามารถในการถ่ายโอนความรู้ข้ามงาน โดยสามารถจัดการงานการสร้างภาพที่หลากหลายภายในกรอบงานเดียว รวมถึงการสร้างภาพ การแก้ไขภาพ การสร้างตามหัวข้อ และการสร้างสภาพภาพ นอกจากนี้ OmniGen ยังสามารถจัดการงานคอมพิวเตอร์วิทัศน์แบบคลาสสิกบางอย่าง เช่น การลดสัญญาณรบกวนของภาพและการตรวจจับขอบ โดยการแปลงงานเหล่านี้เป็นงานสร้างภาพ
ข้อได้เปรียบหลักของ OmniGen อยู่ที่สถาปัตยกรรมที่เรียบง่ายและการดำเนินงานที่เป็นมิตรต่อผู้ใช้ ผู้ใช้สามารถทำงานสร้างภาพที่ซับซ้อนผ่านคำแนะนำง่ายๆ โดยไม่ต้องใช้ปลั๊กอินเพิ่มเติมหรือขั้นตอนการประมวลผลที่ซับซ้อน รูปแบบการเรียนรู้แบบครบวงจรนี้ช่วยให้ OmniGen สามารถถ่ายทอดความรู้ไปยังงานต่างๆ ได้อย่างมีประสิทธิภาพ รับมือกับงานและขอบเขตที่มองไม่เห็น และแสดงให้เห็นถึงความสามารถใหม่ๆ
ความสามารถของรุ่น OmniGen ไม่ได้จำกัดอยู่เพียงข้างต้น แต่ยังรวมถึงความสามารถในการประมวลผลภาพขั้นพื้นฐาน เช่น denoising และการแยกขอบ น้ำหนักและโค้ดของโมเดลได้รับการสร้างเป็นโอเพ่นซอร์ส เพื่อให้ผู้ใช้สามารถสำรวจความสามารถของ OmniGen เพิ่มเติมได้ด้วยตนเอง และปรับแต่งตามความจำเป็น Zhiyuan Research Institute ได้สร้างชุดข้อมูลการสร้างภาพแบบครบวงจรขนาดใหญ่และหลากหลาย X2I ซึ่งประกอบด้วยรูปภาพประมาณ 100 ล้านภาพ ซึ่งจะเป็นโอเพ่นซอร์สในอนาคต เพื่อส่งเสริมการพัฒนาในด้านการสร้างภาพทั่วไป
ลิงค์ที่เกี่ยวข้อง:
บทความ: https://arxiv.org/pdf/2409.11340
รหัส: https://github.com/VectorSpaceLab/OmniGen
สาธิต: https://huggingface.co/spaces/Shitao/OmniGen
โดยรวมแล้ว การเกิดขึ้นของโมเดล OmniGen ได้นำมาซึ่งความเป็นไปได้ใหม่ๆ ในด้านการสร้างภาพ และฟังก์ชันอันทรงพลังและการทำงานที่สะดวกสบายของโมเดลดังกล่าว จะช่วยส่งเสริมการพัฒนาเพิ่มเติมในด้านนี้อย่างแน่นอน น้ำหนักและโค้ดของโมเดลโอเพ่นซอร์สยังมอบทรัพยากรอันมีค่าสำหรับนักพัฒนา เราหวังว่าจะให้ OmniGen นำนวัตกรรมและความก้าวหน้ามาสู่สถานการณ์การใช้งานเพิ่มเติมในอนาคต เครื่องมือแก้ไข Downcodes จะยังคงให้ความสนใจกับความคืบหน้าล่าสุดของโมเดลนี้ต่อไป และนำเสนอรายงานที่เกี่ยวข้องเพิ่มเติมให้กับคุณ