بعد أكثر من مائة يوم من إطلاق Vidu ، أطلقت Thengshu Technology Gradu Vidu الإصدار 1.5 ، والذي حقق تقدمًا رائدًا في العالم في فهم المدخلات المتنوعة وحل مشكلة "الاتساق". هذا يمثل دخول النماذج المرئية في عصر "السياق" ويضع أساسًا متينًا للتطور المتسارع للذكاء الاصطناعي العام (AGI). VIDU 1.5 ليس ترقية وظيفية بسيطة ، ولكنه انعكاس لظهور ذكاء النموذج البصري.
بعد أكثر من 100 يوم من إطلاق Vidu ، أعلنت Thengshu Technology بفخر عن إطلاق الإصدار الجديد من VIDU1.5 ، الذي حقق انفراجًا عن المستوى الرائد في العالم ، وخاصة في فهم المدخلات المتنوعة واختراق مشكلة "الاتساق".
يمثل إطلاق VIDU1.5 دخول النماذج المرئية إلى عصر جديد من "السياق" ويسرع وصول الذكاء الاصطناعي العام (AGI). تتمتع Vidu بالقدرة على توليد شخصيات باستمرار في بداية إطلاقها العالمي ، وحل نقاط الألم الرئيسية في توليد الفيديو من خلال قفل ميزات الوجه للشخصيات. في سبتمبر ، كان Vidu هو الأول في العالم الذي يطلق وظيفة "تناسق الموضوع" ، وتوسيع اتساق الوجه إلى اتساق الجسم بالكامل وتوسيع نطاق إلى أي موضوع مثل الحيوانات والأشياء والشخصيات الافتراضية. تنعكس الاختراقات التكنولوجية لـ Vidu بشكل أساسي في ثلاثة جوانب: التحكم الدقيق في الموضوعات المعقدة ، والاتساق الطبيعي لميزات الوجه والتعبيرات الديناميكية ، والاتساق متعدد الموضوعات.
يُظهر VIDU1.5 "ظهور الذكاء" الجديد للنماذج البصرية ، مما يدل على قدرته القوية على التعلم في السياق. هذا يعني أن النموذج المرئي ليس لديه القدرة على الفهم والتخيل فحسب ، بل يمكنه أيضًا إدارة الذاكرة أثناء عملية التوليد. تواصل VIDU1.5 كفاءة توليدها الرائدة في الصناعة ، مما يولد مقطع فيديو في أقل من 30 ثانية. يلتزم Vidu بمفهوم عالمي ، فلسفة التصميم التي تتوافق مع LLM (نموذج لغة كبير) ، توضح جميع المشكلات في المشكلات في الإدخال البصري والإخراج البصري ، وتستخدم محولًا واحدًا لإدخال وإخراج متغير موحد بشكل موحد ، ويستخدم واحدة المحول لتوحيد نمذجة الإدخال والإخراج بطول المتغير ، ومن بيانات الفيديو الحصول على الذكاء في الضغط.
لا يحسن إطلاق VIDU1.5 من قابلية التحكم في نموذج الفيديو فحسب ، بل يحقق أيضًا توليد متسق من الزوايا المتعددة والموضوعات المتعددة وعناصر متعددة من خلال مدخلات مرنة ومتنوعة. هذا يمثل ظهور الذكاء البصري ويسرع وصول AGI. لم يعد Vidu مجرد مولد فيديو عالي الجودة وفعال ، ويمكنه أيضًا دمج المعلومات السياقية والذاكرة في عملية التوليد. سيكون للنموذج البصري قدرات إدراكية أقوى ويصبح لغزًا مهمًا لـ AGI.
عنوان الخبرة: www.vidu.studio
إن إصدار Vidu 1.5 ليس مجرد اختراق تكنولوجي ، ولكن أيضًا تقدمًا في مجال الذكاء البصري. إنه يوفر إمكانيات جديدة للتطوير المستقبلي لـ AGI ، ويستحق التطلع إلى تطبيقها وابتكارها في المزيد من المجالات. مرحبًا بك لزيارة عنوان التجربة وتجربة سحر الذكاء البصري!