وصلت النسخة 1.6 من أداة Kling لإنشاء الفيديو بالذكاء الاصطناعي من Kuaishou، وحققت قفزة تكنولوجية في ستة أشهر فقط وأصبحت الشركة الرائدة عالميًا في مجال إنشاء الفيديو بالذكاء الاصطناعي. هذا التحديث ليس تكرارًا بسيطًا للإصدار، ولكنه تحسين شامل في واقعية القوانين الفيزيائية وقدرات أداء الشخصية ومستويات الفهم الدلالي، مما يدل على القوة التقنية القوية وقدرات التكرار السريع لفريق Keling. بالمقارنة مع الإصدار السابق، حقق الإصدار 1.6 قفزة نوعية في التكنولوجيا مع الحفاظ على سعر قريب من الناس، مما يوفر للمستخدمين تجربة أكثر واقعية وذكاءً في إنشاء فيديو مدعوم بالذكاء الاصطناعي.
في مجال الذكاء الاصطناعي، تكون سرعة تكرار التكنولوجيا مذهلة دائمًا. تحولت Kling، وهي أداة إنشاء فيديو تعمل بالذكاء الاصطناعي مملوكة لشركة Kuaishou، من شركة مطاردة إلى شركة رائدة عالميًا في مجال إنشاء فيديو الذكاء الاصطناعي في ستة أشهر فقط. يُظهر الإصدار الأخير من الإصدار 1.6 تقدمًا تكنولوجيًا مثيرًا للإعجاب.
على الرغم من أن رقم الإصدار زاد بمقدار 0.1 فقط، إلا أن الاختراقات التقنية التي جلبها الإصدار 1.6 من Keling فاقت التوقعات بكثير. ومع الحفاظ على السعر المناسب وهو 35 إلهامًا/ 5 ثوانٍ من الفيديو، حقق الإصدار الجديد قفزة نوعية في ثلاثة أبعاد أساسية: واقعية القوانين الفيزيائية، وقدرات أداء الشخصية، ومستوى الفهم الدلالي.
لقد تم تحسين واقعية القوانين الفيزيائية بشكل كبير
يعد التفسير الدقيق للعالم المادي هو أهم ما يميز هذا التحديث. في اختبار تقطيع الطماطم، أظهر الإصدار 1.6 من Keling العملية الدقيقة تقريبًا التي يقوم بها طاهٍ محترف، وكان التفاعل بين السكين والمكونات وقوة التقطيع مثيرًا للإعجاب. التأثيرات الجسدية في المشاهد اليومية مثل صب الشاي، والقطط التي تدوس على الأريكة، والكلاب وهي تجري هي أيضًا أكثر واقعية. حتى ترفرف رداء باتمان أثناء السباق مليء بالمشاعر السينمائية، الواقعية والفنية.
التقدم في تعبيرات الشخصية وحركاتها مذهل بنفس القدر. من تجاعيد الحاجب الدقيقة إلى أوضاع الباليه الأنيقة إلى الرقص الصيني الكلاسيكي تحت الماء، يمكن لإصدار Kering 1.6 أن يلتقط بدقة التغيرات العاطفية الدقيقة للشخصيات وحركات الجسم المعقدة. في عودة ظهور مقطع الرقص تحت الماء لقناة Henan الفضائية "Luo Shen"، وصل نطاق حركات الراقصين والتأثيرات الجسدية للأزياء والأشرطة إلى مستوى مذهل.
فيما يتعلق بالفهم الدلالي، يُظهر الإصدار 1.6 من Keling قدرات أقوى في فهم المشهد. سواء كان ذلك عملاً متواصلاً مثل "خلع النظارات واحتضان غزال" أو مشهدًا معقدًا مثل "التراجع ورفع البندقية"، يمكنه فهم محتوى فيديو بدقة وإنشاء محتوى فيديو يلبي التوقعات، مما يعكس قدرته الممتازة على التحليل. تعليمات معقدة.
بالطبع، كتحديث للإصدار 0.1، لا يزال لدى Keling الإصدار 1.6 مجال للتحسين. على سبيل المثال، عند إنشاء محتوى آخر غير الصورة الأصلية، يجب تعزيز توحيد أسلوب الرسم؛ ولا تزال معالجة تفاصيل اليد في المشاهد متعددة الأحرف بحاجة إلى التحسين. لكن هذا الخلل لا يخفي مزاياه وقد أظهر هذا التحديث بشكل كامل المهارات التقنية القوية وقدرات التكرار السريع لفريق Keling.
منذ إطلاقه رسميًا في يونيو، أكمل كيلينج تحوله من "سورا الصين" إلى "كيلينج العالم" في ستة أشهر فقط. على المسار العالمي لتوليد الفيديو بتقنية الذكاء الاصطناعي، يكتب هذا المنتج من شركة Kuaishou فصلاً جديدًا للتكنولوجيا الصينية. لدينا سبب للاعتقاد بأن Keling سيجلب لنا المزيد من المفاجآت في الإصدار 2.0 القادم.
لا يكمن نجاح الإصدار 1.6 من Keling في اختراقاته التقنية فحسب، بل يكمن أيضًا في الابتكار المستمر للفريق الذي يقف وراءه وفهمه الدقيق لاحتياجات المستخدم. أعتقد أنه في المستقبل، سيستمر Keling في قيادة الاتجاه في مجال إنشاء فيديو الذكاء الاصطناعي وتقديم المزيد من التجارب المذهلة للمستخدمين.