قام ByteDance وباحثون من جامعة شنغهاي للعلوم والتكنولوجيا بتطوير تقنية مبتكرة تسمى "HeadGAP" يمكنها بسرعة إنشاء نموذج افتراضي ثلاثي الأبعاد لرأس بشري واقعي ومتحرك باستخدام ثلاث صور فقط للشخص المستهدف من زوايا مختلفة. تتخطى هذه التقنية اعتماد النماذج ثلاثية الأبعاد التقليدية على كميات كبيرة من البيانات والعمليات المعقدة، وتوفر راحة غير مسبوقة لإنشاء شخصيات افتراضية، وتتمتع بقدرات تخصيص شخصية عالية للغاية. من خلال المعلومات المسبقة للرأس ثلاثي الأبعاد المتراكمة في مرحلة "التعلم المسبق"، يمكن لـ HeadGAP إنشاء صور رمزية افتراضية بكفاءة تستعيد خصائص الشخصية المستهدفة بشكل كبير، وتدعم مزامنة تعبيرات الوجه بناءً على مقاطع الفيديو المرجعية.
في الآونة الأخيرة، طور باحثون من ByteDance وجامعة ShanghaiTech دراسة تسمى "HeadGAP" جذبت انتباه الجميع. واقترح فريق البحث طريقة جديدة يمكنها استخدام ثلاث صور فقط من وجهات نظر مختلفة للشخص المستهدف، وباستخدام الصور، يمكنك إنشاء صورة عالية الجودة بسرعة صورة رأس بشري افتراضية واقعية ومتحركة ثلاثية الأبعاد، ومزامنة تعابير الوجه بناءً على مقاطع الفيديو المرجعية.
أظهر فريق البحث كيفية إنشاء صور رمزية مخصصة بكمية صغيرة من البيانات في سيناريوهات حقيقية. في هذه الدراسة، أجرى الباحثون أولاً مرحلة تسمى "التعلم المسبق". في هذه المرحلة، استخرجوا معلومات مسبقة حول الرأس ثلاثي الأبعاد من مجموعة بيانات ديناميكية كبيرة متعددة العرض. يمكن أن تساعد هذه المعلومات المسبقة النظام على فهم ميزات وتعبيرات الرأس المختلفة. بعد ذلك، في مرحلة "إنشاء الصورة الرمزية"، يستخدم الباحثون هذه المعلومات السابقة لإجراء التخصيص الشخصي وإنشاء صورة رمزية افتراضية للشخص المستهدف.
تستخدم العملية برمتها شبكة فك تشفير ذاتية تعتمد على السحب النقطية الغوسية، بالإضافة إلى النمذجة الديناميكية الجزئية. وبهذه الطريقة، يمكن للنظام التقاط الطابع الفريد لكل فرد بسرعة وإجراء تحسين شخصي للصورة الرمزية على هذا الأساس. استخدم الفريق أيضًا بعض الوسائل التقنية، مثل استراتيجيات الانعكاس والضبط الدقيق، لجعل عملية تخصيص الصورة الرمزية أكثر كفاءة، ونجح في النهاية في تحقيق تأثيرات العرض على مستوى الصورة واتساق العرض المتعدد.
وفي التجارب، أظهر فريق البحث أداء طريقتهم في سيناريوهات مختلفة، وأظهرت النتائج أن الصور الرمزية ثلاثية الأبعاد التي تم إنشاؤها يمكن أن تحافظ على جودة عالية وتأثيرات رسوم متحركة مستقرة سواء في بيئة خاضعة للرقابة أو في بيئة حقيقية. لا يوفر هذا الإنجاز آفاقًا واسعة للتطبيق في الشبكات الاجتماعية الافتراضية وتطوير الألعاب وغيرها من المجالات فحسب، بل يوفر أيضًا أفكارًا وأساليب جديدة لإنتاج الصور الرمزية ثلاثية الأبعاد بشكل شخصي.
مدخل المنتج: https://top.aibase.com/tool/headgap
تسليط الضوء على:
واستخدم فريق البحث طريقة "HeadGAP" لإنشاء صورة افتراضية ثلاثية الأبعاد واقعية للرأس مع عدد قليل من الصور فقط.
تستخدم هذه الطريقة شبكة النقاط الغوسية وتقنية النمذجة الديناميكية لتحقيق التخصيص الشخصي وتحسين الصور الرمزية.
تظهر النتائج التجريبية أن الصورة الرمزية التي تم إنشاؤها تتمتع بجودة عرض ممتازة وأداء رسوم متحركة، وهي مناسبة لمجموعة متنوعة من سيناريوهات التطبيق.
يمثل ظهور تقنية HeadGAP علامة فارقة جديدة في تقنية إنشاء الصور الافتراضية ثلاثية الأبعاد، ومن المؤكد أن كفاءتها وراحتها ودقتها العالية ستحقق تأثيرًا ثوريًا في مجالات مثل الواقع الافتراضي والميتافيرس. في المستقبل، يمكننا أن نتوقع استخدام هذه التكنولوجيا في المزيد من المجالات لمنح الأشخاص تجارب افتراضية أكثر واقعية وتخصيصًا.