علم محرر Downcodes أن فريق Zhipu الفني قد فتح مؤخرًا مصدرًا لأحدث طراز لتوليد الفيديو CogVideoX v1.5، وهو تحديث رئيسي آخر لسلسلة CogVideoX منذ أغسطس. يوفر هذا التحديث تحسينات كبيرة في الأداء، ويوفر للمطورين أدوات أكثر قوة لإنشاء الفيديو، ويمثل مرحلة جديدة في تقنية إنشاء الفيديو بالذكاء الاصطناعي. لقد قام CogVideoX v1.5 بتحسين طول الفيديو ودقته ومعدل الإطارات بشكل كبير، كما عزز قدرته على فهم الدلالات المعقدة، مما أدى إلى توسيع سيناريوهات التطبيق الخاصة به.
ومن المفهوم أن هذا التحديث قد أدى إلى تحسين كبير في قدرات إنشاء الفيديو، بما في ذلك دعم مقاطع فيديو مدتها 5 ثوانٍ و10 ثوانٍ، ودقة 768 بكسل، وقدرات إنشاء 16 إطارًا. وفي الوقت نفسه، يدعم نموذج I2V (الصورة إلى الفيديو) أيضًا أي نسبة حجم، مما يعزز القدرة على فهم الدلالات المعقدة.
يحتوي CogVideoX v1.5 على نموذجين رئيسيين: CogVideoX v1.5-5B وCogVideoX v1.5-5B-I2V، وهما مصممان لتزويد المطورين بأدوات أكثر قوة لإنشاء الفيديو.
والأمر الأكثر جدارة بالملاحظة هو أن CogVideoX v1.5 سيتم إطلاقه في نفس الوقت على منصة Qingying ودمجه مع نموذج المؤثرات الصوتية CogSound الذي تم إطلاقه حديثًا ليصبح "New Qingying" . ستوفر Qingying الجديدة عددًا من الخدمات الخاصة، بما في ذلك تحسينات كبيرة في جودة الفيديو والأداء الجمالي وعقلانية الحركة، ودعم إنشاء مقاطع فيديو فائقة الوضوح مدتها 10 ثوانٍ و4K و60 إطارًا.
المقدمة الرسمية هي كما يلي:
يجلب المصدر المفتوح لـ CogVideoX v1.5 حيوية جديدة إلى مجال إنشاء فيديو الذكاء الاصطناعي ويوفر للمطورين المزيد من الإمكانيات. أعتقد أننا سنرى في المستقبل المزيد من التطبيقات المبتكرة المعتمدة على CogVideoX v1.5. سيستمر محرر Downcodes في الاهتمام بآخر التطورات في هذا المجال وسيقدم لك المزيد من التقارير المثيرة.