อาลีบาบาเปิดตัว FLUX.1-Turbo-Alpha: อิงจาก FLUX.1-dev และการปรับแต่ง Lora 8 ขั้นตอน

ผู้เขียน：Eve Cole เวลาอัปเดต：2024-12-03 08:16:01

รายงานตัวแก้ไข Downcodes: ทีมสร้างสรรค์ของ Alimama ได้เปิดตัวโมเดลการสร้างภาพใหม่ FLUX.1-Turbo-Alpha ซึ่งเป็นโมเดล Lora กลั่น 8 ขั้นตอนที่อิงตามการฝึกโมเดล FLUX.1-dev รุ่นนี้ใช้ตัวแยกแยะแบบหลายหัว ซึ่งปรับปรุงคุณภาพของการสร้างภาพอย่างมาก โดยรองรับฟังก์ชันหลายอย่าง เช่น การสร้างข้อความเป็นรูปภาพ เครือข่ายควบคุมการซ่อมแซม ฯลฯ และเข้ากันได้กับเฟรมเวิร์ก Diffusers และ ComfyUI ทำให้ ง่ายสำหรับผู้ใช้ในการเริ่มต้นอย่างรวดเร็ว แบบจำลองนี้ได้รับการฝึกอบรมเกี่ยวกับข้อมูลภาพคุณภาพสูงหลายล้านรายการ คะแนนความสวยงามเกิน 6.3 และความละเอียดสูงกว่า 800 ทำให้มั่นใจได้ถึงผลลัพธ์ภาพคุณภาพสูง สิ่งที่น่าตื่นเต้นยิ่งกว่านั้นคือเวอร์ชันที่มีขั้นต่ำกว่าจะเปิดตัวในอนาคต

เมื่อเร็วๆ นี้ ทีมสร้างสรรค์ของ Alimama ได้เปิดตัว FLUX.1-Turbo-Alpha ซึ่งเป็นโมเดล Lora การกลั่น 8 ขั้นตอนที่ได้รับการฝึกโดยใช้โมเดล FLUX.1-dev

รุ่นนี้ใช้เครื่องแยกแยะแบบหลายหัว ซึ่งปรับปรุงคุณภาพการกลั่นได้อย่างมาก และรองรับการใช้งานที่เกี่ยวข้องกับ FLUX ที่หลากหลาย เช่น การสร้างข้อความเป็นภาพและเครือข่ายควบคุมการซ่อมแซม ทีมงานแนะนำให้ตั้งค่าสเกลไกด์เป็น 3.5 และสเกล Lora เป็น 1 เมื่อใช้งาน เวอร์ชันที่มีจำนวนขั้นน้อยกว่าจะเปิดตัวในอนาคต

FLUX.1-Turbo-Alpha สามารถใช้โดยตรงกับเฟรมเวิร์กตัวกระจายอากาศ ผู้ใช้สามารถโหลดโมเดลและสร้างรูปภาพที่ต้องการด้วยโค้ดเพียงไม่กี่บรรทัด ตัวอย่างเช่น คุณสามารถสร้างฉากสนุกๆ ของตัวสลอธที่ยิ้มแย้มสวมแจ็กเก็ตหนัง หมวกคาวบอย กระโปรงลายสก็อต และโบว์ ยืนอยู่หน้ารถตู้ Volkswagen สุดเก๋ที่ทาสีด้วยทิวทัศน์ของเมือง เพียงปรับพารามิเตอร์ คุณก็สามารถสร้างภาพคุณภาพสูงที่ความละเอียด 1024x1024 ได้

นอกจากนี้ โมเดลนี้ยังเข้ากันได้กับ ComfyUI และใช้สำหรับเวิร์กโฟลว์ข้อความเป็นรูปภาพที่รวดเร็ว หรือเพื่อให้บรรลุเอฟเฟกต์การสร้างที่มีประสิทธิภาพมากขึ้นในเครือข่ายควบคุมการซ่อมแซม ด้วยเทคโนโลยีนี้ ภาพที่สร้างขึ้นสามารถติดตามผลลัพธ์ต้นฉบับได้อย่างใกล้ชิด ปรับปรุงประสบการณ์สร้างสรรค์ของผู้ใช้

กระบวนการฝึกอบรมของ FLUX.1-Turbo-Alpha ก็น่าประทับใจไม่แพ้กัน โมเดลนี้ได้รับการฝึกฝนกับรูปภาพมากกว่า 1 ล้านภาพจากโอเพ่นซอร์สและแหล่งข้อมูลภายใน โดยมีคะแนนความสวยงามมากกว่า 6.3 โดยทั้งหมดที่ความละเอียดสูงกว่า 800 ทีมงานนำวิธีการฝึกอบรมฝ่ายตรงข้ามมาใช้ในระหว่างกระบวนการฝึกอบรมเพื่อปรับปรุงคุณภาพของภาพ และเพิ่มการออกแบบหลายหัวสำหรับเลเยอร์หม้อแปลงแต่ละชั้น สเกลบูตสแตรประหว่างการฝึกได้รับการแก้ไขที่ 3.5, เวลาชดเชยถูกตั้งค่าเป็น 3, ใช้ความแม่นยำแบบผสม bf16, อัตราการเรียนรู้ถูกกำหนดเป็น 2e-5, ขนาดแบตช์คือ 64 และขนาดรูปภาพคือ 1024x1024

การเปิดตัว FLUX.1-Turbo-Alpha ถือเป็นความก้าวหน้าอีกขั้นของ Alimama ในด้านการสร้างภาพ โดยส่งเสริมความนิยมและการประยุกต์ใช้เทคโนโลยีปัญญาประดิษฐ์

ทางเข้าโครงการ : https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha

ไฮไลท์:

รุ่นนี้ใช้ FLUX.1-dev และใช้การกลั่น 8 ขั้นตอนและเครื่องแยกแยะหลายหัวเพื่อปรับปรุงคุณภาพของการสร้างภาพ

ด้วยการสนับสนุนเครือข่ายการควบคุมการสร้างและซ่อมแซมข้อความเป็นรูปภาพ ผู้ใช้จึงสามารถสร้างฉากที่น่าสนใจต่างๆ ได้อย่างง่ายดาย

? กระบวนการฝึกอบรมใช้การฝึกอบรมฝ่ายตรงข้าม และข้อมูลการฝึกอบรมเกิน 1 ล้านภาพเพื่อให้แน่ใจว่าผลลัพธ์ของแบบจำลองมีคุณภาพสูง

โดยรวมแล้ว FLUX.1-Turbo-Alpha นำเสนอความเป็นไปได้ใหม่ๆ ในด้านการสร้างภาพด้วยประสิทธิภาพสูง ความสามารถในการสร้างภาพคุณภาพสูง รวมถึงคุณสมบัติที่สะดวกและใช้งานง่าย ผู้ใช้ที่สนใจสามารถไปที่หน้า Hugging Face เพื่อสัมผัสประสบการณ์โมเดลอันทรงพลังนี้ได้ บรรณาธิการของ Downcodes จะยังคงให้ความสนใจกับความก้าวหน้าล่าสุดของอาลีบาบาในด้านปัญญาประดิษฐ์ และนำเสนอรายงานที่น่าตื่นเต้นอีกมากมายให้กับคุณ