أصدر فريق Google Deepmind نموذجًا من الذكاء الاصطناعى يسمى "جيل Omnimatte". تحقيق مجموعة متنوعة من المؤثرات الخاصة الرائعة. تتخترق هذه التكنولوجيا قيود تقنية الفيديو التقليدية. قل وداعًا للعمليات الشاقة لجعل تحرير الفيديو بسيطًا وسهلًا للبدء ، ويمكن للجميع أن يصبحوا سيدًا لتحرير الفيديو!
هل تتذكر المؤثرات الخاصة الرائعة في الفيلم؟ هذه المؤثرات الخاصة لم تعد حصرية للفيلم!
تعتمد تقنية حصيرة الفيديو التقليدية عادة على تصوير الشاشة الخضراء أو معلومات عمق دقيقة ، وهي معقدة للغاية للعمل. ويتخلص نموذج AI تمامًا من هذه القيود.
جوهر نموذج الذكاء الاصطناعي هذا هو نموذج إزالة الفيديو يسمى "Casper". يشبه فرك المطاط السحري الذي يمكن أن يمحو بدقة أي كائن حددته في الفيديو ، ويختفي بظله وانعكاسه ، لكن الخلفية سليمة.
والأهم من ذلك ، أنه يمكن أيضًا إعادة تدوين الكائنات والخلفيات وفقًا لاحتياجات المستخدمين لتحقيق تأثيرات مبتكرة مختلفة ، مثل "نقل" الشخصية من مشهد إلى آخر ، أو تغيير سرعة الحركة للكائن حركة الكائن ، أو حتى اترك حركة الكائن ، أو حتى اترك حركة الكائن ، أو حتى ترك حركة الكائن ، أو حتى ترك حركة الكائن ، أو حتى اترك حركة الكائن ، أو حتى اترك حركة الكائن ، أو حتى اترك حركة الكائن ، أو حتى اترك حركة الكائن.
مع هذا القطع الأثرية ، سيكون من السهل جدًا إجراء تحرير الفيديو في المستقبل到海边的背景上就搞定了 , 是不是很简单؟
بالطبع ، لا يزال Omnimatte التوليدي في مرحلة البحث والتطوير ، وهناك بعض الأخطاء الصغيرة التي يجب حلها. على سبيل المثال ، إذا كان هناك العديد من الكائنات المماثلة في الفيديو ، فقد لا تكون الذكاء الاصطناعى قادرين على التمييز بين من هو ويشعلها. بالإضافة إلى ذلك ، إذا كان الكائن قد خضع لتشوه ، مثل عمود الانحناء ، فإن الذكاء الاصطناعى لا يعرف ما يجب التعامل معه. ومع ذلك ، أعتقد أن فريق Google DeepMind يمكنه قريبًا حل هذه المشكلات وجعل Omnimatte أكثر مثالية!
عنوان المشروع: https://gen-mnimatte.github.io/
عنوان الأطروحة: https: //arxiv.org/pdf/2411.16683
جلبت Omnimatte التوليد تغييرات ثورية على محرري الفيديو.