أصدرت شركة Zhipu AI جيلًا جديدًا من نموذج إنشاء الفيديو CogVideoX، والذي يتمثل جوهره في تحسين كفاءة وجودة إنشاء الفيديو بشكل كبير، مما يمثل إنجازًا كبيرًا للشركة في مجال التكنولوجيا متعددة الوسائط. حققت CogVideoX ابتكارات متعددة على المستوى الفني وتم فتحها للمستخدمين من خلال منصة Zhipu Qingyan، مما يوفر خدمات مريحة لإنشاء فيديو AI وتوفير واجهات اتصال API للمؤسسات والمطورين.
أطلقت شركة Zhipu AI جيلًا جديدًا من نموذج توليد الفيديو CogVideoX، مما يمثل تقدمًا مهمًا آخر في تطوير التكنولوجيا متعددة الوسائط للشركة.
تشمل الميزات التقنية الأساسية لـ CogVideoX ما يلي:
بنية التشفير التلقائي المتغيرة ثلاثية الأبعاد (3D VAE): يمكن لهذه البنية التي طورتها شركة Zhipu AI بشكل مستقل ضغط بيانات الفيديو الأصلية إلى 2% من الحجم الأصلي، مما يقلل من تكلفة التدريب وصعوبةه. ومن خلال دمجه مع وحدة ترميز موضع RoPE ثلاثية الأبعاد، فإنه يعمل على تحسين القدرة على التقاط العلاقات بين الإطارات في البعد الزمني وإنشاء تبعيات طويلة المدى في مقاطع الفيديو.
نموذج فهم الفيديو من طرف إلى طرف: إنه يعزز قدرة النموذج على فهم النص واتباع التعليمات، مما يضمن أن الفيديو الذي تم إنشاؤه أكثر انسجاما مع احتياجات المستخدم ويمكنه التعامل مع التعليمات السريعة الطويلة للغاية والمعقدة.
بنية المحولات التي تدمج النص والوقت والمساحة في ثلاثة أبعاد: تم تصميم Expert Block بشكل مبتكر لمحاذاة مساحات الوسائط النصية والفيديو، وتحسين التفاعل بين الوسائط من خلال آلية الاهتمام الكامل.
تم إطلاق نموذج CogVideoX على الكمبيوتر الشخصي وتطبيقات الهاتف المحمول والبرامج المصغرة لـ Zhipu Qingyan. ويمكن للمستخدمين تجربة خدمات الفيديو المولدة بالنص والصور المولدة بالذكاء الاصطناعي مجانًا من خلال وظيفة "Ying". تشمل الميزات الرئيسية لـ Qingying الإنشاء السريع، وقدرات متابعة الأوامر الفعالة، وتماسك المحتوى، ومرونة جدولة الشاشة.
بالإضافة إلى ذلك، قامت Bigmodel.cn، وهي منصة مفتوحة للنماذج الكبيرة، بنشر "Qingying"، ويمكن للمؤسسات والمطورين استخدام وظائفها من خلال استدعاءات واجهة برمجة التطبيقات (API). لقد تحققت شركة Zhipu AI من فعالية قانون القياس في مجال توليد الفيديو، وستستمر في توسيع نطاق البيانات وحجم النماذج والبحث في بنيات النماذج الجديدة لضغط معلومات الفيديو بشكل أكثر كفاءة ودمج محتوى النص والفيديو بشكل أكثر شمولاً.
عنوان التجربة: https://top.aibase.com/tool/qingying-ai-shipinshengchengfuwu
لا يوفر إطلاق CogVideoX للمستخدمين تجربة أكثر ملاءمة لإنشاء فيديو بالذكاء الاصطناعي فحسب، بل يشير أيضًا إلى أن تقنية إنشاء الفيديو بالذكاء الاصطناعي ستبدأ مرحلة جديدة من التطوير. في المستقبل، ستواصل شركة Zhipu AI استكشاف المزيد من البنى النموذجية المتقدمة والحلول التقنية لتعزيز التقدم المستمر لتكنولوجيا توليد الفيديو بالذكاء الاصطناعي.