โมเดลขนาดใหญ่ Hunyuan DiT (HunyuanDiT) ของ Tencent ยังคงได้รับการอัปเดตซ้ำๆ ทำให้ผู้ใช้มีความสามารถในการสร้างภาพที่ทรงพลังมากขึ้น บรรณาธิการของ Downcodes ได้เรียนรู้ว่า HunyuanDiT และชุมชนเพิ่งเปิดตัวปลั๊กอินที่ควบคุมได้ใหม่ 3 ตัว ได้แก่ ControlNet ได้แก่ ไทล์ (การขยายภาพความละเอียดสูง) การลงสี (การซ่อมแซมและขยายภาพ) และเส้นตรง (การวาดเส้น) ซึ่งช่วยเพิ่มประสิทธิภาพการทำงานของโมเดลได้อย่างมาก แอพพลิเคชั่นที่หลากหลายและอิสระในการสร้างสรรค์ การเพิ่มปลั๊กอินเหล่านี้ช่วยให้ Hunyuan DiT แสดงศักยภาพการใช้งานที่แข็งแกร่งยิ่งขึ้นในสาขาศิลปะ ความคิดสร้างสรรค์ สถาปัตยกรรม และสาขาอื่นๆ โดยให้บริการสร้างภาพที่แม่นยำและสะดวกสบายยิ่งขึ้นแก่นักพัฒนาและนักสร้างสรรค์ทั่วโลก
เมื่อเร็วๆ นี้ HunyuanDiT โมเดลขนาดใหญ่ (HunyuanDiT) ของ Tencent ได้ร่วมมือกับชุมชนเพื่อเปิดตัวปลั๊กอินที่ควบคุมได้ใหม่ 3 ตัว ได้แก่ ControlNet ได้แก่ ไทล์ (การขยายภาพความละเอียดสูง) การลงสี (การซ่อมแซมและขยายภาพ) และภาพเชิงเส้น (การวาดเส้น) เพื่อขยายเพิ่มเติม เมทริกซ์ ControlNet ของมัน การเพิ่มปลั๊กอินเหล่านี้ช่วยให้โมเดล Hunyuan DiT ครอบคลุมสถานการณ์การใช้งานที่หลากหลายขึ้น ซึ่งรวมถึง 80% ของกรณีและสถานการณ์ต่างๆ เช่น ศิลปะ ความคิดสร้างสรรค์ สถาปัตยกรรม การถ่ายภาพ ความงาม และอีคอมเมิร์ซ โดยให้บริการแก่องค์กรระดับโลกและนักพัฒนารายบุคคล และผู้สร้างด้วย ให้การสร้างภาพที่แม่นยำยิ่งขึ้นและมีอิสระในการสร้างสรรค์ที่มากขึ้น
ปลั๊กอิน Tile สามารถขยายข้อมูลสำหรับภาพและให้การขยายภาพที่ชัดเจนเป็นพิเศษ แม้กระทั่งถึงความละเอียด 4K ถึง 8K ซึ่งเหมาะสำหรับฉากที่ต้องการการติดตามรายละเอียดของภาพขั้นสูงสุด ปลั๊กอิน Inpainting สามารถเติมส่วนที่เปื้อนและรอยด่างของรูปภาพได้ตามความต้องการของผู้สร้าง บรรลุเอฟเฟกต์ต่างๆ เช่น การเปลี่ยนพื้นหลังและการเปลี่ยนแปลงวัตถุของตัวละคร และจัดการการวาดภาพใหม่ในพื้นที่ขนาดใหญ่ ปลั๊กอิน Lineart ใช้เส้นประเภทต่างๆ เพื่อสร้างภาพในชีวิตจริง แอนิเมชั่น และภาพสถาปัตยกรรม และเหมาะสำหรับการสร้างการเรนเดอร์สถาปัตยกรรมและการระบายสีต้นฉบับ
นอกจากนี้ Tencent Hunyuan DiT ยังได้เปิดตัวโมเดล ControlNet ที่มีคุณสมบัติพิเศษ (ขอบ) ความลึก (ความลึก) ท่าทาง (ท่าทางของมนุษย์) และเงื่อนไขอื่นๆ เพื่อสนับสนุนนักพัฒนาในการให้เหตุผล และได้เปิดโปรแกรมการฝึกอบรม ControlNet แบบโอเพ่นซอร์สเพื่อให้นักพัฒนาและผู้สร้างสามารถ ความสามารถในการฝึกโมเดล ControlNet แบบกำหนดเอง
นับตั้งแต่ประกาศการอัปเกรดและโอเพ่นซอร์สอย่างครอบคลุมในเดือนพฤษภาคม Hunyuan DiT ซึ่งเป็นโมเดลการสร้างกราฟแบบโอเพ่นซอร์สสถาปัตยกรรม DiT สัญชาติจีนตัวแรกของอุตสาหกรรม ยังคงสร้างระบบนิเวศของนักพัฒนาอย่างต่อเนื่อง และเปิดตัวไลบรารีการเร่งความเร็วพิเศษ เพื่อปรับปรุงประสิทธิภาพการใช้เหตุผลและลดการสร้างกราฟให้สั้นลง และเปิดรหัสอนุมานเพิ่มเติม ในเดือนกรกฎาคม Hunyuan DiT ได้รับการอัปเกรดเป็นเวอร์ชัน 1.2 และเวอร์ชันหน่วยความจำวิดีโอขนาดเล็กเป็นแบบโอเพ่นซอร์ส โดยต้องใช้หน่วยความจำวิดีโอเพียง 6G จึงจะทำงานได้ ทำให้เป็นมิตรกับนักพัฒนาที่ใช้งานภายในคอมพิวเตอร์ส่วนบุคคลมากขึ้น
ปัจจุบัน Hunyuan DiT มีดาวมากกว่า 3.1,000 ดาวบน Github ทำให้เป็นโมเดลโอเพ่นซอร์ส DiT ในประเทศที่ได้รับความนิยมมากที่สุด
เว็บไซต์อย่างเป็นทางการ
https://dit.hunyuan.tencent.com/
รหัส
https://github.com/Tencent/HunyuanDiT
แบบอย่าง
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
กระดาษ
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
โดยรวมแล้ว การอัปเดตอย่างต่อเนื่องและกลยุทธ์โอเพ่นซอร์สของ Tencent Hunyuan DiT ช่วยให้นักพัฒนาและผู้สร้างมีเครื่องมือและทรัพยากรอันทรงพลัง และส่งเสริมความก้าวหน้าและการพัฒนาเทคโนโลยี Wenshengtu เป็นสิ่งที่ควรค่าแก่การรอคอยที่จะมีนวัตกรรมและการพัฒนาใหม่ๆ เพิ่มเติมในอนาคต