أصدرت Sensetime مؤخرًا نموذج توليد الفيديو "VIMI" الثوري للتحكم في الشخصيات ، مما يمثل خطوة مهمة للأمام في مجال إنشاء الفيديو. لا توضح هذه التكنولوجيا المبتكرة قوة Sensetime العميقة في مجال الذكاء الاصطناعي فحسب ، بل تفتح أيضًا إمكانيات جديدة لإنشاء محتوى الفيديو.
يعتمد Vimi Big Model على تطوير تكنولوجيا النموذج الكبير الرائد في Sensetime ، مما يدل على مرونة غير مسبوقة في توليد الفيديو. يمكن أن يتلقى النموذج أشكالًا مختلفة من المدخلات ، بما في ذلك الفيديو ، والرسوم المتحركة ، والمواد الصوتية ، ووصف النص ، وتحويل هذه العناصر بدقة إلى مقاطع فيديو أحرف حية. تتيح إمكانية الإدخال متعددة الوسائط هذه VIMI للتكيف مع سيناريوهات معقدة مختلفة ، مما يوفر لمبدعي المحتوى حرية وإمكانيات إبداعية أكبر.
من حيث إمكانية التحكم ، حقق VIMI اختراقات كبيرة. لا يمكن فقط التحكم بدقة في تعبيرات الوجه للشخصيات ، ولكن أيضًا تحقيق تعديلات مفصلة على حركات الجسم. يجعل هذا الاختراق التكنولوجي محتوى الفيديو الذي تم إنشاؤه أكثر طبيعية وسلسة ، ويصل أيضًا إلى مستوى جديد في التعامل مع التفاصيل مثل الشعر والملابس والخلفية. يدعم VIMI التغييرات الحقيقية في الضوء والظل ، مما يجعل الجمهور تجربة بصرية أكثر غامرة.
أظهر Vimi أداءً ممتازًا من حيث وقت توليد الفيديو. يمكن لهذا النموذج أن يولد مقاطع فيديو أحرف أحادية الطلق بشكل ثابت حتى دقيقة واحدة ، مما يخترق الحد الأقصى لتكنولوجيا توليد الفيديو AI الحالية. الأمر الأكثر إثارة للإعجاب هو أنه مع زيادة طول الفيديو ، تظل جودة الصورة مستقرة ولا يوجد تدهور أو تشويه ، مما يضمن اتساق وجودة محتوى الفيديو.
جلبت هذه التكنولوجيا المبتكرة لـ Sensetime تغييرات ثورية في مجال إنشاء محتوى الفيديو ، ليس فقط تحسين كفاءة وجودة إنتاج الفيديو ، ولكن أيضًا تزويد المبدعين بأدوات إبداعية غير مسبوقة. مع التطوير المستمر لتكنولوجيا الذكاء الاصطناعي ، يمكننا أن نتوقع من Vimi تقديم سيناريوهات تطبيق أكثر إثارة للدهشة في المستقبل.
عنوان تجربة التطبيق: https://www.wjx.cn/vm/mhsxfgv.aspx