أصدر فريق DA-Group من جامعة Peking Model Magic1-For-1 ، والذي يمكن أن يولد مقاطع فيديو لمدة دقيقة واحدة في دقيقة واحدة فقط. تأتي كفاءتها من تحسين استخدام الذاكرة وتأخير الاستدلال ، وتحلل مهمة توليد الفيديو إلى مهامين فرعيين: نص إلى الصورة والصورة إلى الفيديو ، وبالتالي تحسين كفاءة التدريب وتحسين دقة التوليد. يوفر الإصدار المفتوح المصدر لهذا النموذج أدوات قوية للبحوث ذات الصلة ويوفر المزيد من الاحتمالات للمطورين والباحثين.
في الآونة الأخيرة ، أطلق فريق DA-Group-PKU نموذجًا جديدًا لتوليد الفيديو يسمى "Magic1-For-1". مقطع فيديو طويل. تعمل هذه التكنولوجيا على تحسين كفاءة توليد الفيديو بشكل كبير من خلال تحسين استخدام الذاكرة وتقليل زمن الاستدلال.
ينقسم نموذج Magic1-for-1 مهمة توليد الفيديو إلى مهامين رئيسيين: توليد نص إلى صورة وتوليد صورة إلى الفيديو. من خلال هذا التحلل ، لا يحسن الفريق كفاءة التدريب فحسب ، بل يحقق أيضًا تأثيرات أكثر دقة لتوليد الفيديو. لا يوفر إصدار هذا النموذج أدوات جديدة للبحث في الحقول ذات الصلة ، ولكن أيضًا يفتح المزيد من الاحتمالات للمطورين والباحثين.
في نفس الوقت الذي يتم فيه إصدار التكنولوجيا ، يوفر الفريق أيضًا التقارير التقنية المقابلة والأوزان النموذجية والرموز للمستخدمين المهتمين للتنزيل والاستخدام. أنها تشجع المزيد من المطورين والباحثين على المشاركة في المشروع والترويج بشكل مشترك لتقدم تقنية توليد الفيديو التفاعلية. لراحة المستخدم ، يوفر الفريق أدلة إعداد بيئة مفصلة ، بما في ذلك كيفية إنشاء بيئة بيثون مناسبة وتثبيت مكتبات التبعية المطلوبة.
بالإضافة إلى ذلك ، يدعم Magic1-For-1 أيضًا مجموعة متنوعة من أوضاع الاستدلال ، بما في ذلك إعدادات GPU و GPU المفردة ، مما يتيح للمستخدمين اختيار طريقة التوليد الأكثر ملاءمة وفقًا لظروف أجهزتهم الخاصة. يمكن للمستخدمين إكمال بناء وتشغيل النموذج في بضع خطوات بسيطة ، ويمكنهم زيادة تحسين سرعة الاستدلال من خلال التكنولوجيا الكمية.
يمثل إطلاق هذه التكنولوجيا تقدمًا مهمًا في مجال توليد الصورة إلى الفيديو ، مع إمكانات تطوير مستقبلية ضخمة. وآمل أن ينضم المزيد من الناس إلى هذا في مجالات البحث المثيرة.
المشروع: https://github.com/da-group-pku/magic-1-for-1
النقاط الرئيسية:
** جيل فعال **: يمكن أن يولد طراز Magic1-for-1 مقطع فيديو لمدة دقيقة واحدة في دقيقة واحدة ، وتحسين استخدام الذاكرة وتقليل زمن الاستدلال.
** الموارد المفتوحة **: أصدر الفريق التقارير الفنية ، والأوزان النموذجية والرمز ، والمطورين والباحثين مرحب بهم للمشاركة في المساهمة.
** التفكير المرن **: يدعم إعدادات GPU و GPU متعددة GPU ، ويمكن للمستخدمين اختيار وضع التشغيل المناسب وفقًا لاحتياجاتهم.
سيعزز إصدار نموذج Magic1-For-1 بلا شك تطوير تقنية توليد الصورة إلى الفيديو ، وخصائصها الفعالة والمفتوحة والمرنة تجعلها واعدة للغاية في التطبيق. نتطلع إلى استخدام النموذج على نطاق واسع وتحسينه بشكل مستمر في المستقبل.