يستمر تحديث نموذج Hunyuan DiT الكبير (HunyuanDiT) من Tencent بشكل متكرر، مما يوفر للمستخدمين إمكانات أكثر قوة لتوليد الصور. علم محرر Downcodes أن HunyuanDiT والمجتمع أطلقوا مؤخرًا ثلاثة مكونات إضافية جديدة يمكن التحكم فيها، وهي ControlNet، وهي Tile (تضخيم عالي الوضوح)، وinpainting (إصلاح الصور وتوسيعها)، وLineart (رسم الخطوط)، مما يعزز أداء النموذج بشكل كبير مجموعة من التطبيقات والحرية الإبداعية. تسمح إضافة هذه المكونات الإضافية لشركة Hunyuan DiT بإظهار إمكانات تطبيق أقوى في مجالات الفن والإبداع والهندسة المعمارية وغيرها من المجالات، مما يوفر خدمات أكثر دقة وملاءمة لتوليد الصور للمطورين والمبدعين حول العالم.
تعاون نموذج HunyuanDiT الكبير (HunyuanDiT) من Tencent مؤخرًا مع المجتمع لإصدار ثلاثة مكونات إضافية جديدة يمكن التحكم فيها، ControlNet، وهي Tile (تضخيم عالي الوضوح)، وinpainting (إصلاح الصور وتوسيعها)، وLineart (رسم الخطوط)، لمزيد من التوسع مصفوفة ControlNet الخاصة بها. تتيح إضافة هذه المكونات الإضافية لنموذج Hunyuan DiT تغطية نطاق أوسع من سيناريوهات التطبيق، بما في ذلك 80% من الحالات والسيناريوهات مثل الفن والإبداع والهندسة المعمارية والتصوير الفوتوغرافي والجمال والتجارة الإلكترونية، مما يوفر للشركات العالمية والمطورين الأفراد والمبدعين الذين يوفرون إنشاء صور أكثر دقة وحرية إبداعية أكبر.
يمكن للمكون الإضافي Tile توسيع معلومات الصورة وتحقيق تضخيم فائق الوضوح، حتى يصل إلى دقة 4K إلى 8K، وهو مناسب للمشاهد التي تتطلب السعي النهائي لتفاصيل الصورة. يمكن للمكون الإضافي Inpainting ملء الأجزاء الملطخة والمرقشة من الصورة وفقًا لاحتياجات المنشئ، وتحقيق تأثيرات مثل استبدال الخلفية وتغيير موضوع الشخصية، والتعامل مع إعادة رسم صورة بمساحة كبيرة. يستخدم المكون الإضافي Lineart أنواعًا مختلفة من الخطوط لإنشاء صور واقعية ورسوم متحركة وصور معمارية، وهو مناسب لإنشاء عروض معمارية وتلوين المخطوطات.
بالإضافة إلى ذلك، أصدرت Tencent Hunyuan DiT سابقًا نماذج ControlNet ذات الدقة (الحافة)، والعمق (العمق)، والوضعية (وضعية الإنسان) وغيرها من الشروط لدعم المطورين في التفكير، وفتحت برنامج ControlNet التدريبي لتمكين المطورين والمبدعين من القدرة على تدريب نماذج ControlNet المخصصة.
منذ الإعلان عن ترقية شاملة ومفتوحة المصدر في مايو، واصلت Hunyuan DiT، باعتبارها أول نموذج لإنشاء الرسوم البيانية مفتوحة المصدر لهندسة DiT الصينية الأصلية في الصناعة، بناء نظام بيئي للمطورين وأصدرت مكتبة تسريع حصرية لتحسين كفاءة التفكير وتقصير إنشاء الرسوم البيانية الوقت ومزيد من فتح رمز الاستدلال. في يوليو، تمت ترقية Hunyuan DiT إلى الإصدار 1.2، وكان إصدار ذاكرة فيديو صغير مفتوح المصدر ولا يتطلب تشغيله سوى 6 جيجا بايت، مما يجعله أكثر ملاءمة للمطورين المنتشرين محليًا على أجهزة الكمبيوتر الشخصية.
حاليًا، لدى Hunyuan DiT أكثر من 3.1 ألف نجم على Github، مما يجعلها نموذج DiT مفتوح المصدر المحلي الأكثر شعبية.
الموقع الرسمي
https://dit.hunyuan.tencent.com/
شفرة
https://github.com/Tencent/HunyuanDiT
نموذج
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
ورق
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
بشكل عام، توفر التحديثات المستمرة لـ Tencent Hunyuan DiT وإستراتيجية المصدر المفتوح للمطورين والمبدعين أدوات وموارد قوية، وتعزز تقدم وتطوير تكنولوجيا Wenshengtu. ومن الجدير التطلع إلى المزيد من الابتكارات والاختراقات في المستقبل.