Alibaba ได้เปิดซอร์สโมเดลการสร้างภาพใหม่ล่าสุด Qwen2vl-Flux โมเดลนี้มีประสิทธิภาพและรองรับการทำงานที่หลากหลาย เช่น การแก้ไขภาพ การผสม และการผสม และสามารถสร้างภาพใหม่ที่คล้ายกันอย่างมากโดยอิงตามภาพหรือข้อความที่ผู้ใช้ให้มา เครื่องมือแก้ไขของ Downcodes จะพาคุณไปเรียนรู้เพิ่มเติมเกี่ยวกับโมเดล AI ที่น่าทึ่งนี้ และดูว่าโมเดลนี้มีฟังก์ชันที่น่าทึ่งใดบ้าง ไม่เพียงแต่สามารถสร้างภาพหลายมุมและหลายอารมณ์จากภาพเดียวเท่านั้น แต่ยังรวมภาพและข้อความอย่างชาญฉลาด และแม้กระทั่งบรรลุการผสมผสานระหว่างภาพต่างๆ ได้อย่างราบรื่น เช่น การรวมตัวละครหรือการเปลี่ยนฉาก สิ่งที่น่าแปลกใจยิ่งกว่านั้นคือยังมีฟังก์ชันการย้ายรูปแบบตาราง ทำให้ผู้ใช้สามารถปรับแต่งภาพและสร้างสรรค์ภาพที่สร้างสรรค์มากขึ้น
เมื่อเร็วๆ นี้ อาลีบาบาได้ประกาศเปิดตัวโอเพ่นซอร์สของโมเดลการสร้างภาพที่พัฒนาขึ้นใหม่ Qwen2vl-Flux โมเดลนี้ไม่เพียงแต่มีฟังก์ชันหลายอย่าง เช่น การแก้ไข การผสม และการผสม แต่ยังสามารถสร้างรูปภาพใหม่ๆ ที่คล้ายกันมากเมื่อผู้ใช้ป้อนรูปภาพหรือข้อความ ภาพ.
Qwen2vl-Flux มีฟังก์ชันการเปลี่ยนภาพอันทรงพลัง ผู้ใช้เพียงแค่ต้องป้อนรูปภาพโดยไม่ต้องแจ้งข้อความใดๆ และโมเดลก็สามารถสร้างรูปภาพที่คล้ายกันหลายรูปโดยอิงจากรูปภาพต้นฉบับได้ ตัวอย่างเช่น หากผู้ใช้อัปโหลดรูปถ่ายของตัวละคร โมเดลจะสามารถสร้างการนำเสนอตัวละครจากหลายมุม โดยแสดงมุมมองและอารมณ์ที่แตกต่างกัน
โมเดลนี้ยังรองรับการผสมรูปภาพที่มีข้อความนำทางด้วย เมื่อผู้ใช้ป้อนรูปภาพและแนบข้อความที่เกี่ยวข้อง Qwen2vl-Flux จะสามารถผสานรวมรูปภาพที่ป้อนและเนื้อหาข้อความได้อย่างชาญฉลาดเพื่อสร้างเอฟเฟกต์รูปภาพใหม่
นอกเหนือจากคุณสมบัติข้างต้นแล้ว Qwen2vl-Flux ยังมีความสามารถในการผสมรูปภาพที่มีการนำทางด้วยรูปภาพอีกด้วย ผู้ใช้สามารถรวมภาพสองภาพที่แตกต่างกันเพื่อให้เกิดการรวมตัวละครหรือการแปลงฉาก ตัวอย่างเช่น การรวมตัวละครเข้ากับพื้นหลังอื่น โมเดลสามารถผสมผสานทั้งสองอย่างอย่างลงตัวเพื่อสร้างเอฟเฟกต์ภาพใหม่
คุณสมบัติการถ่ายโอนรูปแบบตาข่ายของโมเดลช่วยให้ผู้ใช้ควบคุมภาพของตนได้อย่างละเอียด ผู้ใช้สามารถแก้ไขส่วนเฉพาะของรูปภาพเพื่อให้ได้การสร้างสรรค์ที่ประณีต ตัวอย่างเช่น ในภาพที่แสดงให้เห็นการผสมผสานระหว่างเทคโนโลยีขั้นสูงและสภาพแวดล้อมทางธรรมชาติ ผู้ใช้สามารถเพิ่มรายละเอียดของเทคโนโลยีการเรืองแสงจากสิ่งมีชีวิตหรือเอฟเฟกต์ของหมอกยามเช้าในป่าเพื่อแสดงประสบการณ์การมองเห็นที่สมบูรณ์ยิ่งขึ้น
ทางเข้าโครงการ: https://huggingface.co/Djrango/Qwen2vl-Flux
โอเพ่นซอร์สของ Qwen2vl-Flux นำเสนอความเป็นไปได้ใหม่ๆ ในด้านการสร้างภาพ และมอบเครื่องมืออันทรงพลังแก่นักพัฒนา ฟังก์ชันที่หลากหลายและการใช้งานที่สะดวกสบายทำให้มีคุณค่าอย่างยิ่งในการแก้ไขและสร้างสรรค์ภาพ คุ้มค่าที่จะรอคอยความสามารถในการสร้างผลลัพธ์ที่น่าทึ่งยิ่งขึ้นในอนาคต!