"เกี่ยวอะไรกับการทำลายคุณ" นี่เป็นประโยคที่ใช้อธิบายสงครามระหว่างมนุษย์กับไทรโซลารันในนิยายวิทยาศาสตร์ของ Liu Cixin เรื่อง "ปัญหาสามร่าง"
ปัจจุบัน “การโจมตีการลดขนาด” ที่คล้ายกันนี้กำลังเกิดขึ้นในอุตสาหกรรมวิดีโอเช่นกัน ตั้งแต่เดือนมิถุนายน ตั้งแต่การเปลี่ยนใบหน้าไปจนถึงการสร้างคำเลียนเสียง จากแฟนตาซีไปจนถึงการจำลอง โมเดลวิดีโอ AI ในประเทศและต่างประเทศ เช่น Adobe, Kuaishou Keling และ Zhipu Qingying ได้นำมาซึ่ง ในช่วงการเปิดตัวอย่างเข้มข้นได้ส่งผลกระทบต่ออุตสาหกรรมวิดีโอแบบเดิมในแง่ของต้นทุน
เมื่อเปรียบเทียบกับในอดีต ผลิตภัณฑ์เหล่านี้เกินความคาดหมายในแง่ของการปรับเอฟเฟกต์ให้เหมาะสม นวัตกรรมเชิงฟังก์ชัน และการใช้งานแอปพลิเคชัน ในการแข่งขัน “AI video war” ของการแข่งขันโมเดลขนาดใหญ่รอบนี้ มีบริษัทใดบ้างที่เป็นแถวหน้า?
“ครึ่งหลัง” การแข่งขันโมเดลขนาดใหญ่ วิดีโอ AI หายไปไหน?
ในเดือนกุมภาพันธ์ของปีนี้ Open AI ที่หลายคนตั้งตารอคอยได้เปิดตัวโซระโมเดลวิดีโอขนาดใหญ่ ซึ่งเรียกความสนใจของตลาดอย่างกว้างขวางในเส้นทางการสร้างวิดีโอ AI อย่างไรก็ตาม จนถึงทุกวันนี้ Sora ยังคงเปิดให้ทดลองใช้งานเพียงไม่กี่คนเท่านั้น และยังไม่ได้เปิดตัวอย่างเป็นทางการ
ตามคำแถลงของ Open AI สาเหตุหลักที่ทำให้ Sora ยังอยู่ในขั้นตอนการวิจัยก็คือ "การสื่อสารของบริษัทกับผู้กำหนดนโยบายยังคงดำเนินอยู่" ตามรายงานของสื่อต่างประเทศ Open AI กำลังติดต่อกับผู้ที่เกี่ยวข้องจาก YouTube, Hollywood และอื่น ๆ เพื่อขอรับการสนับสนุนเพิ่มเติม มิรา มูรัต ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของ Open AI กล่าวว่า "ก่อนการเปิดตัวอย่างเป็นทางการ ต้นทุนในการสร้าง Sora จะต้องลดลงก่อน เนื่องจากต้นทุนปัจจุบัน 'แพงเกินไป'"
นับตั้งแต่ปีนี้ บริษัทขนาดใหญ่ที่มีนวัตกรรมอย่างน้อย 10 แห่งในและต่างประเทศได้เปิดตัวผลิตภัณฑ์ใหม่หรืออัปเกรดโมเดลที่เกี่ยวข้องกับวิดีโอ AI และส่วนใหญ่เปิดให้ผู้ใช้ทุกคน
ที่มา: รายงานวิจัยการลงทุนด้านการก่อสร้างของ CITIC
จากข้อมูลที่ให้ไว้ในรายงานการวิจัยข้างต้น ในช่วงเดือนมิถุนายนถึงตุลาคม 2567 อุตสาหกรรมวิดีโอ AI มีการเปลี่ยนแปลง 3 ประการหลักๆ ดังนี้
จากมุมมองนี้ มันเป็น "ช่วงกรอบเวลา" ที่ Open AI ทิ้งไว้เนื่องจากการพิจารณาต้นทุนที่ทำให้บริษัทอื่นๆ ในเส้นทางนี้มองเห็นโอกาสและก้าวไปข้างหน้า
มาร์กซ์กล่าวว่า: "นายทุนจะขายเชือกที่เขาใช้ผูกคอตาย" เช่นเดียวกัน ในตลาดทุน เงินจะไหลไปในที่ที่ควรไป เหตุผลที่บริษัทจำนวนมากและเงินร้อนหลั่งไหลเข้าสู่อุตสาหกรรมวิดีโอ AI ก็เนื่องมาจากการพัฒนาอย่างรวดเร็วของเทคโนโลยี AI กำลังเปลี่ยนโฉมอุตสาหกรรมการผลิตวิดีโอ จึงมีศักยภาพทางการตลาดมหาศาล
จากการคำนวณของ Soochow Securities ภายใต้สมมติฐานที่เป็นกลาง พื้นที่ที่มีศักยภาพสำหรับอุตสาหกรรมที่สร้างโดยวิดีโอ AI ของจีนอยู่ที่ 317.8 พันล้านหยวน โดยพื้นที่ตลาด C-end และ B-end อยู่ที่ 267.3 พันล้านหยวนและ 50.5 พันล้านหยวน ตามลำดับ
การสนับสนุนหลักในการสร้างตลาดระดับ 100 พันล้านนี้คือบริษัทผลิตวิดีโอที่มีอยู่จำเป็นต้องลดต้นทุนและเพิ่มประสิทธิภาพ ความต้องการนี้จะยังคงส่งเสริมการเพิ่มขึ้นของอัตราการเจาะของ AI ในด้านการผลิตวิดีโอ ดังนั้น ส่งผลให้บริษัทที่เกี่ยวข้องมีรายได้เพิ่มมากขึ้น
ในแง่ของการลดต้นทุน ยกตัวอย่างภาพยนตร์ ตามการคำนวณของ Soochow Securities ก่อนปี 2018 ต้นทุนการผลิตภาพยนตร์แต่ละเรื่องที่ผลิตโดยใช้วิธีดั้งเดิมอยู่ที่ประมาณ 23 ล้านหยวนถึง 170 ล้านหยวนต่อเรื่อง หลังจากเพิ่ม AI แล้ว ไม่เพียงแต่จะทำให้วงจรการผลิตสั้นลงเท่านั้น แต่ยังเข้ามาแทนที่บุคลากรบางส่วนในการผลิตและโปรโมตภาพยนตร์อีกด้วย ซึ่งท้ายที่สุดแล้ว ต้นทุนการผลิตของภาพยนตร์แต่ละเรื่องก็ลดลงเหลือ 25,000 หยวน ซึ่งลดต้นทุนได้มากกว่า 95% ในที่สุด
ในแง่ของการเพิ่มประสิทธิภาพ เมื่อพิจารณาจากผลิตภัณฑ์ที่เปิดตัวจนถึงตอนนี้ เทคโนโลยีการผลิตวิดีโอ AI เองก็ยังคงมีการพัฒนาอย่างรวดเร็ว ตั้งแต่การมาถึงของเทคโนโลยีการสร้างวิดีโอในต้นปี 23 จนถึงการเปิดตัว Sora ในเดือนกุมภาพันธ์ปีนี้ ใช้เวลาเพียงหนึ่งปี ปีนี้ Kuaishou Keling เปิดตัวในเดือนมิถุนายนและผ่านการวนซ้ำ 9 ครั้งในสามเดือน ความเข้าใจในแบบจำลอง ความสามารถในการควบคุมผลลัพธ์ที่สร้างขึ้น และอัตราผลตอบแทนล้วนดีขึ้น
ในเดือนกรกฎาคมปีนี้ Douyin และ Kuaishou ได้เปิดตัวละครสั้นเรื่อง AI เรื่อง "Sanxingdui: Apocalypse of the Future" และ "Mountain and Sea Wonderland: Breaking Waves" ตามลำดับ โดยเป็นผู้นำในการเปิดการประยุกต์ใช้ AI ในวงการนี้ ของวิดีโอสั้น ๆ
ในเดือนกันยายน แพลตฟอร์มวิดีโอแบบดั้งเดิมหลัก 3 แพลตฟอร์ม "Aiyouteng" ก็เริ่มเพิ่มการรองรับการสร้าง AI เช่นกัน ยกตัวอย่าง Youku โดยเพิ่งประกาศกฎการแบ่งปันละครสั้นใหม่ ราคาต่อหน่วยระดับ S ของละครสั้นพิเศษเพิ่มขึ้นจาก 6 หยวนเป็น 16 หยวน และราคาต่อหน่วยระดับ A เพิ่มขึ้นจาก 4 หยวนเป็น 8 หยวน นอกจากค่าสัมประสิทธิ์ความใหม่แล้ว ส่วนแบ่งรายได้ของละครสั้นที่มีประสิทธิภาพข้อมูลที่ดียังอาจเพิ่มขึ้นสูงถึง 120% อีกด้วย Youku สัญญาว่า 70% ของรายได้จะมอบให้กับผู้ผลิต
จากมุมมองนี้ วิดีโอ AI กำลังผ่านการทำซ้ำที่คล้ายกับโมเดล AI ขนาดใหญ่ และมีการพัฒนาอย่างเป็นธรรมชาติโดยมีต้นทุนต่ำลง ขอบเขตการใช้งานที่กว้างขึ้น และความสามารถทางเทคนิคที่สูงขึ้น เมื่อเครื่องมือวิดีโอ AI ได้รับการอัปเกรดจาก "ของเล่น" เป็น "เครื่องมือเพิ่มประสิทธิภาพ" พวกเขาอาจนำไปสู่ "ความเป็นเอกเทศ" ในระดับผู้ใช้ ซึ่งจะขับเคลื่อนมู่เล่ข้อมูลและส่งเสริมการพัฒนาอุตสาหกรรมต่อไป
ในยุคของ AI แบบข้อความ Open AI ในสหรัฐอเมริกาเป็นผู้นำในบรรดาบริษัท AI ระดับโลก และกลายเป็น "บริษัทแรกที่ลองใช้" เนื่องจากข้อได้เปรียบทางเทคนิคในด้านพลังการประมวลผลและอัลกอริธึมพื้นฐาน ในยุคของวิดีโอ AI บริษัทอินเทอร์เน็ตรายใหญ่ของจีนได้เร่งฝีเท้าอย่างเห็นได้ชัด และไม่ต้องการเป็น "ผู้ติดตาม" อีก
ก่อนหน้านี้ Byte ได้วางตำแหน่งการตัดฟิล์มให้เป็นโปรเจ็กต์ระดับ P0 ซึ่งนำโดยอดีตซีอีโอ Zhang Nan เพื่อแสวงหาความก้าวหน้าในการสร้างสรรค์โดยใช้ AI จาง หนาน กล่าวว่า "เทคโนโลยีการสร้างภาพ AI จะนำการเปลี่ยนแปลงครั้งใหญ่และความเป็นไปได้มาสู่อุตสาหกรรมเครื่องมือสร้างเนื้อหา" Kuaishou ยกให้ "Keling" เป็นโครงการเชิงกลยุทธ์ นำโดย Wan Pengfei ผู้เชี่ยวชาญด้านเทคโนโลยี หลังจากเริ่มโครงการในเวลาไม่ถึงหนึ่งเดือน ได้รับการสนับสนุนจาก Cheng Yixiao ในแง่ของเงินทุน, GPU, ความสามารถพิเศษ ฯลฯ นอกจากนี้ บริษัทต่างๆ เช่น Meitu และ Wondershare Technology ยังได้เพิ่มฟังก์ชันวิดีโอ AI ของตนด้วย และเปิดตัว Meitu Fantasy, Wondershare Sky Screen และ AI มัลติโมดัลขนาดใหญ่อื่นๆ โมเดล
เหตุผลที่พวกเขาให้ความสำคัญอย่างมากกับโครงการวิดีโอ AI ไม่ใช่แค่การหารายได้เท่านั้น แต่การพิจารณาที่สำคัญกว่านั้นคือการแข่งขันเพื่อการรับส่งข้อมูล ท้ายที่สุดแล้ว ด้วยการสนับสนุนของ AI เกณฑ์ในการสร้างสรรค์จะลดลง ทำให้ผู้ใช้สามารถเปลี่ยนจากผู้บริโภคเนื้อหามาเป็นผู้ผลิตเนื้อหาได้มากขึ้น ส่งผลให้มีการจัดหาเนื้อหาที่สมบูรณ์ยิ่งขึ้น และชนะยุคใหม่ของ AI "การต่อสู้เพื่อการรับส่งข้อมูล" .
ยิ่งไปกว่านั้น เมื่อเปรียบเทียบกับ Open AI ผู้ผลิตวิดีโอและการตัดต่อในประเทศมักมีการสะสมข้อมูลวิดีโอมากกว่า จากข้อมูลของ Quest Mobile วิดีโอสั้น MAU มีจำนวนถึง 1 พันล้านในเดือนมิถุนายน 2567 และเวลาใช้งานเฉลี่ยต่อเดือนของผู้ใช้รายเดียวนั้นยาวนานถึง 61 ชั่วโมง ซึ่งเร็วกว่าช่องทางอื่นๆ อย่างมาก และเน้นไปที่แอปพลิเคชันหลักของ Douyin และ Kuaishou อย่างสูง .
การสะสมเหล่านี้สามารถช่วยให้ผู้ผลิตในจีนได้เปรียบในแง่ของข้อมูลการฝึกอบรม สถานการณ์การใช้งาน และขนาดผู้ใช้เมื่อพัฒนาโมเดลวิดีโอ AI ข้อมูลเป็นกุญแจสำคัญในการฝึกอบรมโมเดลคุณภาพสูง สถานการณ์จะกำหนดความสามารถในการปรับตัวของตลาดและศักยภาพทางการค้าของผลิตภัณฑ์ และผู้ใช้สามารถให้ข้อเสนอแนะเกี่ยวกับผลิตภัณฑ์เพื่อช่วยให้ทำซ้ำได้เร็วขึ้น
เป็นเพราะความเป็นผู้นำของปัจจัยหลักสามประการข้างต้น ทำให้ Douyin และ Kuaishou แซงหน้า OpenAI ไปแล้ว โดยเป็นผู้นำในการเปิดยุคแห่งการเปิดกว้างของวิดีโอ AI ในจีน ซึ่งเป็นตลาดผู้บริโภควิดีโอที่ใหญ่ที่สุดในโลก Meitu และ Wondershare กำลังเร่งแสวงหา Adobe ด้านการตัดต่อวิดีโอด้วย AI
จากมุมมองนี้ ในยุคของวิดีโอ AI หากคุณต้องการเป็นผู้นำในอุตสาหกรรม คุณไม่เพียงต้องสะสมเนื้อหาฐานวิดีโอในเชิงลึกเท่านั้น แต่ยังต้องมีความสามารถในการฝึกอบรมโมเดล AI ที่ยอดเยี่ยม และต้องสามารถทนต่อ การทดสอบสถานการณ์การใช้งานของผู้ใช้ ใน "การปฏิวัติอุตสาหกรรมวิดีโอ" ที่เกิดจาก AI ยักษ์ใหญ่ด้านวิดีโอของจีนอาจรับบทบาทเป็นผู้นำ