أصدرت OpenAI مؤخرًا نموذجها المرتقب لتوليد الفيديو Sora Turbo، مما يمثل إنجازًا كبيرًا في مجال الذكاء الاصطناعي التوليدي في عام 2024. قام Sora Turbo بتحسين كفاءة ومدة إنشاء الفيديو بشكل كبير، حيث يمكنه إنشاء مقاطع فيديو عالية الوضوح بدقة 1080 بكسل لمدة تصل إلى 20 ثانية استنادًا إلى النصوص أو الصور أو مطالبات الفيديو، ويدعم مجموعة متنوعة من الوظائف، مثل النقاط الفائقة والدرجات الفائقة. تعمل مجموعة ألعاب الإطار وHDR على تحسين تجربة المستخدم بشكل كبير. وظائفها القوية واستخدامها المريح تجعلها واحدة من نماذج الفيديو ذات أطول وقت جيل في العالم.
أصدرت OpenAI المنتج المرتقب Sora Turbo في البث المباشر اليوم، مما يمثل إنجازًا كبيرًا في مجال الذكاء الاصطناعي التوليدي في عام 2024. تم تحسين كفاءة توليد Sora Turbo بشكل كبير، ويمكنه إنشاء مقاطع فيديو بدقة 1080P مباشرة لمدة تصل إلى 20 ثانية من النص، مما يجعله أحد نماذج الفيديو ذات أطول وقت جيل في العالم. يدعم هذا النموذج إدخال النص بالإضافة إلى الصور أو مقاطع الفيديو لإنشاء محتوى فيديو محدد، مما يجعل تأثير التوليد أكثر قابلية للتحكم.
تتضمن الميزات الفنية المميزة لـ Sora Turbo دعمًا كاملاً للألعاب لمجموعات الألعاب ذات النقاط الفائقة والإطار الفائق وHDR، بالإضافة إلى ترقيتين للوظائف تم تطويرهما ذاتيًا استنادًا إلى رسومات مستقلة. من بينها، يمكن لوظيفة إدخال الإطار الديناميكي باللمس تحسين دقة إدخال الإطار بشكل كبير وتقليل تلف الصورة. يستخدم الوضع الليلي المظلم للعبة خوارزميات الذكاء الاصطناعي لتحسين التفاصيل المظلمة وتعزيز التأثيرات المرئية للمناطق المظلمة، مع حل مشكلة السطوع أثناء اللعب. الألعاب في بيئات الإضاءة المظلمة.
حاليًا، دخلت Sora مرحلة الاستخدام غير المحدود بالنسبة لأعضاء ChatGPT Plus وPro، لا توجد تكلفة إضافية لاستخدام Sora. قامت OpenAI أيضًا بتطوير واجهة مستخدم جديدة وتوفر خدمات المشاركة المجتمعية، مما يسمح للمستخدمين بمشاركة مقاطع الفيديو التي تم إنشاؤها الخاصة بهم أو التعلم من التأثيرات الفورية لأشخاص آخرين لتحسين أعمالهم.
تتضمن المبادئ التقنية لـ Sora تطبيق التصحيحات، التي تسمح بالتدريب المكثف على كميات كبيرة من بيانات الصور والفيديو، وتطبيق شبكات ضغط الفيديو، التي تقلل من أبعاد البيانات المرئية وتحسن جودة المخرجات.
يدمج Sora أيضًا نموذج الانتشار وبنية المحولات، باستخدام طريقة محولات الانتشار المبتكرة لتحل محل بنية U-Net التقليدية، مما يحسن بشكل فعال القدرة على التقاط علاقة التوزيع بين صور الإدخال والتسميات النصية. بالإضافة إلى ذلك، قدم Sora تقنية إعادة الترجمة الخاصة بـ DALL・E3 لإنشاء ترجمات نصية لجميع مقاطع الفيديو في مجموعة التدريب من خلال تدريب نموذج ترجمة وصفي للغاية، مما يحسن دقة النص والجودة الإجمالية للفيديو.
عنوان التجربة: https://sora.com/
لا يؤدي ظهور Sora Turbo إلى تحسين كفاءة وجودة إنشاء فيديو الذكاء الاصطناعي فحسب، بل يوفر أيضًا للمستخدمين أدوات إبداعية أكثر ملاءمة وقوة. تعمل وظيفة السياسة المفتوحة والمشاركة المجتمعية في OpenAI على تعزيز تعميم تكنولوجيا الذكاء الاصطناعي وتطويرها. أعتقد أن Sora Turbo سيلعب دورًا أكبر في مجال إنشاء فيديو الذكاء الاصطناعي في المستقبل وسيجلب المزيد من المفاجآت للمستخدمين.