تقدم هذه المقالة طريقة Diffusion-Vas المكونة من مرحلتين والتي تعتمد على الانتشار المسبق، والتي تُستخدم لحل مشكلة الانسداد في تجزئة كائن الفيديو. يمكن لهذه الطريقة أن تؤدي بشكل فعال تجزئة الفيديو وإكمال المحتوى، ويمكنها تتبع الهدف بدقة واستعادة شكله الكامل حتى عندما يكون الكائن محجوبًا بالكامل. من خلال الجمع بين تسلسل القناع المرئي وخريطة العمق الزائف، يستطيع Diffusion-Vas استنتاج انسداد حدود الكائن، واستخدام نموذج التوليد الشرطي لإكمال محتوى منطقة الانسداد، مما يؤدي في النهاية إلى إنشاء نموذج كامل عالي الدقة. محتوى RGB مجاني. تظهر نتائج الاختبار المعياري لهذه الطريقة على مجموعات بيانات متعددة أن أدائها أفضل من أداء العديد من الطرق الحالية، خاصة في السيناريوهات المعقدة.
في مجال تحليل الفيديو، يعد فهم ثبات الكائن أمرًا بالغ الأهمية. يكمن ابتكار طريقة Diffusion-Vas في معالجتها للأشياء المشروطة، واختراق قيود الأساليب التقليدية التي تركز فقط على الأشياء المرئية. يجمع تصميمه المكون من مرحلتين بذكاء بين إنشاء القناع وإكمال المحتوى، مما يحسن بشكل فعال دقة وقوة تحليل الفيديو. وفي المستقبل، من المتوقع أن يتم استخدام هذه التكنولوجيا على نطاق واسع في مجالات مثل القيادة الذاتية وتحليل فيديو المراقبة، مما يوفر دعمًا قويًا لفهم فيديو أكثر دقة وشمولاً. عنوان المشروع: https://diffusion-vas.github.io/