ทีมวิจัยของสถาบันปัญญาประดิษฐ์แห่งปักกิ่งได้เปิดตัวโมเดลการสร้างภาพใหม่ OmniGen ซึ่งทำลายข้อจำกัดด้านฟังก์ชันเดียวของเครื่องมือสร้างภาพแบบดั้งเดิม OmniGen แตกต่างจากรุ่นต่างๆ เช่น Stable Diffusion โดยผสานรวมฟังก์ชันต่างๆ มากมาย เช่น การสร้างข้อความเป็นภาพ และการแก้ไขภาพภายใต้กรอบการทำงานแบบครบวงจร ทำให้เป็น "รอบด้าน" บรรณาธิการของ Downcodes จะอธิบายรายละเอียดเกี่ยวกับพลังของ OmniGen และโอกาสในการใช้งาน
เมื่อเร็วๆ นี้ ทีมวิจัยของสถาบันปัญญาประดิษฐ์แห่งปักกิ่งได้เปิดตัวโมเดลการสร้างภาพใหม่ที่เรียกว่า OmniGen
โปรแกรมสร้างและแก้ไขภาพรอบด้าน
เมื่อเปรียบเทียบกับเครื่องมือสร้างภาพรุ่นก่อนๆ เช่น Stable Diffusion จุดเด่นที่สุดของ OmniGen ก็คือไม่เพียงแค่มุ่งเน้นไปที่งานเดียวอีกต่อไป แต่ยังมีความสามารถที่หลากหลาย:
สามารถจัดการงานการสร้างภาพได้หลากหลายภายใต้กรอบงานที่เป็นหนึ่งเดียว ตั้งแต่ข้อความไปจนถึงการสร้างภาพ และการแก้ไขภาพ เรียกได้ว่าเป็นงานรอบด้าน
ซึ่งหมายความว่าผู้ใช้เพียงแค่ระบุคำง่ายๆ เพื่อควบคุมการสร้างภาพและการแก้ไขอย่างละเอียด และไม่จำเป็นต้องใช้ปลั๊กอิน เช่น ControlNet และ IP-Adapter เพื่อปรับรายละเอียดของภาพอีกต่อไป!
AIbase นี้มีพื้นฐานมาจากการให้คำพร้อมท์เอฟเฟกต์โดยละเอียดสำหรับการถ่ายภาพเชิงสร้างสรรค์ด้วยกล้องรุ่นเก่า เอฟเฟกต์โดยรวมที่สร้างขึ้นนั้นเต็มไปด้วยรายละเอียดและเอฟเฟกต์มีดังนี้:
จากการทดสอบหลายครั้ง OmniGen ดำเนินการได้อย่างน่าประทับใจ โดยเทียบได้กับรุ่นที่ทันสมัยที่สุดในตลาดสำหรับการสร้างข้อความเป็นรูปภาพ บนเกณฑ์มาตรฐาน GenEval นั้น OmniGen ใช้รูปภาพเพียง 0.1 พันล้านภาพในการฝึกอบรม ในขณะที่ SD3 ใช้รูปภาพมากกว่า 1 พันล้านภาพ
ความสามารถในการแก้ไขภาพก็ยอดเยี่ยมไม่แพ้กัน โดยสามารถควบคุมภาพต้นฉบับและคำแนะนำในการแก้ไขได้อย่างแม่นยำ ตัวอย่างเช่น ในชุดทดสอบ EMU-Edit นั้นเหนือกว่ารุ่นที่รู้จักกันดี เช่น InstructPix2Pix และยังเทียบได้กับรุ่น EMU-Edit ที่ล้ำสมัยในปัจจุบันอีกด้วย
ในงานของรุ่นที่ขับเคลื่อนด้วยหัวเรื่อง OmniGen ได้แสดงให้เห็นถึงความสามารถในการปรับแต่งเฉพาะบุคคลที่ไม่ธรรมดา และเหมาะสำหรับหลายสาขา เช่น การสร้างงานศิลปะและการออกแบบโฆษณา
ที่อยู่ทดลอง: https://huggingface.co/spaces/Shitao/OmniGen
บทความ: https://arxiv.org/html/2409.11340v1
OmniGen นำเสนอความก้าวหน้าครั้งใหม่ในด้านการสร้างภาพด้วยฟังก์ชันอันทรงพลังและประสิทธิภาพที่มีประสิทธิภาพ วิธีการใช้งานที่ง่ายและสะดวกยังช่วยลดเกณฑ์ในการสร้างภาพและให้ผู้ใช้มีเครื่องมือสร้างสรรค์ที่สะดวกสบายมากขึ้น คาดว่า OmniGen จะมีการใช้งานที่กว้างขึ้นในอนาคต และส่งเสริมการพัฒนาเพิ่มเติมของเทคโนโลยีการสร้างภาพปัญญาประดิษฐ์