أصدر فريق البحث من جامعة تورنتو ومعهد Vector مؤخرًا نموذج CAP4D، وهو عبارة عن تقنية مبتكرة لإنشاء الصور الرمزية رباعية الأبعاد. وهو يعتمد على نموذج نشر العرض المتعدد القابل للتشوه (MMDM) ويمكنه إنشاء صور رمزية رباعية الأبعاد واقعية يمكن التحكم فيها في الوقت الفعلي من أي عدد من الصور المرجعية، مما يؤدي إلى تحسين كبير في تأثير إعادة بناء الصورة الرمزية وعرض التفاصيل. لا تستطيع هذه التقنية معالجة صورة واحدة أو عدد صغير من الصور المرجعية فحسب، بل يمكنها أيضًا إنشاء صور رمزية من المطالبات النصية أو الأعمال الفنية، مما يدل على قدرتها القوية على التكيف وقدراتها التوليدية. تستخدم طريقتها المكونة من مرحلتين أولاً MMDM لإنشاء صور بمنظورات وتعبيرات مختلفة، ثم تجمع الصور المرجعية لإعادة بناء الصور الرمزية رباعية الأبعاد، وهي تدعم الدمج مع نماذج تحرير الصور الحالية ونماذج الرسوم المتحركة المعتمدة على الصوت لتحقيق تفاعلات وتأثيرات ديناميكية أكثر ثراءً توفر التطبيقات صورًا رمزية افتراضية تفتح إمكانيات جديدة.
يعتمد النموذج طريقة من مرحلتين، أولاً استخدام MMDM لإنشاء صور بمنظورات وتعبيرات مختلفة، ثم دمج هذه الصور المولدة مع الصور المرجعية لإعادة بناء صورة رمزية رباعية الأبعاد يمكن التحكم فيها في الوقت الفعلي. يمكن للمستخدمين إدخال أي عدد من الصور المرجعية، وسيستخدم النموذج معلومات الصورة هذه لإنشاء صور رمزية رباعية الأبعاد عالية الجودة، ويدعم الدمج مع نماذج الرسوم المتحركة المعتمدة على الصوت لتحقيق تأثيرات ديناميكية تعتمد على الصوت. يمثل ظهور نموذج CAP4D تقدمًا كبيرًا في تقنية إنشاء الصور الرمزية رباعية الأبعاد، والتي تتمتع بآفاق تطبيق واسعة في مجالات مثل الواقع الافتراضي والألعاب والميتافيرس.
أظهر فريق البحث مجموعة متنوعة من الصور الرمزية التي تم إنشاؤها بواسطة CAP4D، والتي تغطي صورة مرجعية واحدة، وعددًا صغيرًا من الصور المرجعية، والسيناريو الأكثر تحديًا المتمثل في إنشاء الصور الرمزية من المطالبات النصية أو الأعمال الفنية. باستخدام صور مرجعية متعددة، يستطيع النموذج استعادة التفاصيل والأشكال الهندسية التي لا يمكن رؤيتها في صورة واحدة، مما يحسن أداء إعادة الإعمار. بالإضافة إلى ذلك، يتمتع CAP4D أيضًا بالقدرة على الدمج مع نماذج تحرير الصور الموجودة، مما يسمح للمستخدمين بتحرير مظهر وإضاءة الصورة الرمزية التي تم إنشاؤها.
من أجل تحسين تعبير الصورة الرمزية بشكل أكبر، يمكن لـ CAP4D الجمع بين الصورة الرمزية رباعية الأبعاد التي تم إنشاؤها ونموذج الرسوم المتحركة الذي يحركه الصوت لتحقيق تأثيرات الرسوم المتحركة التي يحركها الصوت. وهذا يسمح للصورة الرمزية ليس فقط بعرض التأثيرات المرئية الثابتة، ولكن أيضًا التفاعل ديناميكيًا مع المستخدمين من خلال الصوت، مما يؤدي إلى إنشاء حقل جديد من تطبيقات الصور الرمزية الافتراضية.
أبرز النقاط:
يمكن لنموذج CAP4D إنشاء صور رمزية رباعية الأبعاد عالية الجودة من أي عدد من الصور المرجعية، باستخدام سير عمل على مرحلتين.
يمكن لهذه التقنية إنشاء صور رمزية من مجموعة متنوعة من وجهات النظر المختلفة، مما يؤدي إلى تحسين كبير في تأثير إعادة بناء الصورة وعرض التفاصيل.
يتم دمج CAP4D مع نموذج الرسوم المتحركة الذي يحركه الصوت لتحقيق الصور الرمزية الديناميكية التي تعتمد على الصوت وتوسيع سيناريوهات تطبيق الصور الرمزية الافتراضية.
بشكل عام، حقق نموذج CAP4D طفرة كبيرة في مجال إنشاء الصور الرمزية رباعية الأبعاد، وقد أتت ميزاته الفعالة والواقعية ومتعددة الوظائف بإمكانيات جديدة في مجالات مثل الواقع الافتراضي والترفيه الرقمي. وفي المستقبل، من المتوقع أن تتطور هذه التقنية بشكل أكبر لتزويد المستخدمين بتجربة تفاعلية افتراضية أكثر ملاءمة وواقعية.