อาลีบาบาได้โอเพ่นซอร์สโมเดลการสร้างภาพใหม่ล่าสุด Qwen2vl-Flux ซึ่งมีฟังก์ชันการแก้ไขภาพ การผสม และการผสมภาพที่ทรงพลัง และสามารถสร้างภาพใหม่ที่คล้ายกันอย่างมากโดยอิงตามภาพหรือข้อความที่ผู้ใช้ให้มา รองรับหลายโหมด เช่น การสร้างภาพที่คล้ายคลึงกันโดยอิงตามภาพเท่านั้น การผสมภาพตามข้อความ และการผสมภาพตามภาพ ผู้ใช้สามารถควบคุมกระบวนการสร้างภาพได้อย่างยืดหยุ่นเพื่อให้ได้ภาพที่ได้รับการขัดเกลา การเกิดขึ้นของ Qwen2vl-Flux ได้นำมาซึ่งความเป็นไปได้ใหม่ๆ ในด้านการสร้างภาพ และฟีเจอร์โอเพ่นซอร์สช่วยให้นักพัฒนาและนักวิจัยใช้งานได้ง่ายขึ้น บทความนี้จะแนะนำโดยละเอียดเกี่ยวกับฟังก์ชันหลักและสถานการณ์การใช้งานของ Qwen2vl-Flux
เมื่อเร็วๆ นี้ อาลีบาบาได้ประกาศเปิดตัวโอเพ่นซอร์สของโมเดลการสร้างภาพที่พัฒนาขึ้นใหม่ Qwen2vl-Flux โมเดลนี้ไม่เพียงแต่มีฟังก์ชันหลายอย่าง เช่น การแก้ไข การผสม และการผสม แต่ยังสามารถสร้างรูปภาพใหม่ๆ ที่คล้ายกันมากเมื่อผู้ใช้ป้อนรูปภาพหรือข้อความ ภาพ.
Qwen2vl-Flux มีฟังก์ชันการเปลี่ยนภาพอันทรงพลัง ผู้ใช้เพียงแค่ต้องป้อนรูปภาพโดยไม่ต้องแจ้งข้อความใดๆ และโมเดลก็สามารถสร้างรูปภาพที่คล้ายกันหลายรูปโดยอิงจากรูปภาพต้นฉบับได้ ตัวอย่างเช่น หากผู้ใช้อัปโหลดรูปถ่ายของตัวละคร โมเดลจะสามารถสร้างการนำเสนอตัวละครจากหลายมุม โดยแสดงมุมมองและอารมณ์ที่แตกต่างกัน
โมเดลนี้ยังรองรับการผสมรูปภาพที่มีข้อความนำทางด้วย เมื่อผู้ใช้ป้อนรูปภาพและแนบข้อความที่เกี่ยวข้อง Qwen2vl-Flux จะสามารถผสานรวมรูปภาพที่ป้อนและเนื้อหาข้อความได้อย่างชาญฉลาดเพื่อสร้างเอฟเฟกต์รูปภาพใหม่
นอกเหนือจากคุณสมบัติข้างต้นแล้ว Qwen2vl-Flux ยังมีความสามารถในการผสมรูปภาพที่มีการนำทางด้วยรูปภาพอีกด้วย ผู้ใช้สามารถรวมภาพสองภาพที่แตกต่างกันเพื่อให้เกิดการรวมตัวละครหรือการแปลงฉาก ตัวอย่างเช่น การรวมตัวละครเข้ากับพื้นหลังอื่น โมเดลสามารถผสมผสานทั้งสองอย่างอย่างลงตัวเพื่อสร้างเอฟเฟกต์ภาพใหม่
คุณสมบัติการถ่ายโอนรูปแบบตาข่ายของโมเดลช่วยให้ผู้ใช้ควบคุมภาพของตนได้อย่างละเอียด ผู้ใช้สามารถแก้ไขส่วนเฉพาะของรูปภาพเพื่อให้ได้การสร้างสรรค์ที่ละเอียดยิ่งขึ้น ตัวอย่างเช่น ในภาพที่แสดงให้เห็นการผสมผสานระหว่างเทคโนโลยีขั้นสูงและสภาพแวดล้อมทางธรรมชาติ ผู้ใช้สามารถเพิ่มรายละเอียดของเทคโนโลยีการเรืองแสงจากสิ่งมีชีวิตหรือเอฟเฟกต์ของหมอกยามเช้าในป่าเพื่อแสดงประสบการณ์การมองเห็นที่สมบูรณ์ยิ่งขึ้น
ทางเข้าโครงการ: https://huggingface.co/Djrango/Qwen2vl-Flux
ไฮไลท์:
Qwen2vl-Flux เป็นโอเพ่นซอร์สและมีความสามารถในการสร้างและแก้ไขภาพอันทรงพลัง
รองรับการเปลี่ยนแปลงรูปภาพและการผสมผสานรูปภาพที่มีข้อความแนะนำเพื่อสร้างเอฟเฟกต์ภาพใหม่
มีการผสมผสานรูปภาพที่แนะนำและการย้ายสไตล์กริด ทำให้ผู้ใช้สามารถควบคุมได้อย่างละเอียด
โดยรวมแล้ว Qwen2vl-Flux ได้นำความก้าวหน้าที่สำคัญมาสู่ด้านการสร้างและแก้ไขภาพด้วยฟังก์ชันอันทรงพลังและฟีเจอร์โอเพ่นซอร์ส และมันก็คุ้มค่าที่จะรอคอยการใช้งานและการพัฒนาในอนาคต ผู้สนใจสามารถเยี่ยมชมทางเข้าโครงการเพื่อสัมผัสและเรียนรู้