กำแพงมิติ AI ระหว่างฉันกับฮัลโลวีนดูเหมือนว่า PixVerse V3 จะถูกทำลาย

ผู้เขียน：Eve Cole เวลาอัปเดต：2024-11-21 14:42:02

เมื่อเร็วๆ นี้ ความวุ่นวายของโครงการ OpenAI และ Sora ทำให้โลกภายนอกกังวลเกี่ยวกับอุตสาหกรรมวิดีโอ AI ที่คึกคัก

เมื่อปลายเดือนกันยายน Mira Murati ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของ OpenAI และ Barrett Zoff รองประธานฝ่ายวิจัย ซึ่งมีบทบาทสำคัญในการพัฒนาโมเดล o1, GPT-4o และ GPT-4v และหัวหน้า เจ้าหน้าที่วิจัย Bob McGrew ก็ประกาศลาออกเช่นกัน

เมื่อวันที่ 4 ตุลาคม Tim Brooks ผู้นำโครงการ Sora ได้ประกาศลาออกอย่างเป็นทางการบนแพลตฟอร์มโซเชียล X และเข้าร่วม Google DeepMind

หากคุณกินมันพร้อมกับความจริงที่ว่าไม่มีตารางเวลาที่แน่นอนสำหรับเวอร์ชันอย่างเป็นทางการของ Sora มันจะเหมือนกับละครที่คุ้นเคยซึ่งฟองสบู่ของโปรเจ็กต์ดาราแตกออกและทุกคนในเกมก็มีแผนของตัวเอง

ล่าสุดการแข่งขันวิดีโอ AI เริ่มเข้มข้นมากขึ้น

ตามสถิติของ SameWeb จำนวนการเข้าชมเว็บไซต์ Luma AI ของบริษัทผลิตวิดีโอ AI ชั้นนำของโลกในเดือนกันยายนอยู่ที่เพียง 11.81 ล้านครั้ง ลดลง 38.49% เมื่อเทียบเป็นรายเดือน pika ยอดฮิตยังทำให้ยอดเข้าชมลดลงในเดือนกันยายน แม้ว่าจะได้รับความนิยมอีกครั้งด้วยชุดเอฟเฟกต์เทมเพลตใหม่ในเวอร์ชันใหม่ในเดือนตุลาคม แต่คำถามที่ว่าผลิตภัณฑ์จะสามารถดึงดูดความสนใจของผู้ใช้ต่อไปได้อย่างไรก็ค่อยๆ ผุดขึ้นมา

ในตอนแรกบางคนเริ่มกังวลเรื่อง Sora อยู่ขณะกำลังถูกประเมินใหม่ เช่น ผู้สร้างภาพยนตร์ Patrick Cederberg กล่าวเมื่อเดือนเมษายนว่าเขาต้องให้นางแบบสร้างคลิปสั้นหลายร้อยคลิปก่อนจึงจะสามารถหาคลิปสั้นได้ กล่าวอีกนัยหนึ่ง Sora นั้นใช้งานยากมาก

โชคดีที่ Tim Brooks ยังไม่ได้บอกลาวิดีโอ AI เขาน่าจะเข้าร่วม Veo ซึ่งเป็นเครื่องมือสร้างวิดีโอ AI ของ DeepMind การเพิ่มขึ้นและลดลงของ Sora อาจไม่ใช่เกณฑ์มาตรฐานเดียวสำหรับอุตสาหกรรมวิดีโอ AI อย่างน้อยก็ในแง่ของความสามารถ ผู้ท้าชิงอย่าง Meta Movie Gen เริ่มอ้างว่าได้ฆ่า Sora ระบบนิเวศของผลิตภัณฑ์วิดีโอ AI ในประเทศยังอยู่ระหว่างการเปลี่ยนแปลงใหม่ๆ

การระบายความร้อนของแทร็กวิดีโอ AI หรืออีกนัยหนึ่งก็คือช่วงตั้งครรภ์ก่อนที่ผลิตภัณฑ์ที่ดีกว่าชุดถัดไปจะถูกทำซ้ำ เมื่อเร็ว ๆ นี้ดูเหมือนว่าผลิตภัณฑ์ที่น่าทึ่งเพียงพอจะเข้าสู่สายตาของสาธารณชนแล้ว

PixVerse V3 ทำลายกำแพงมิติได้อย่างแท้จริง

เนื่องจากผลิตภัณฑ์วิดีโอ AI ในตลาดมีมากมายจนผู้คนเริ่มประสบกับ "ความเมื่อยล้าทางการมองเห็น" PixVerse V3 มีความพิเศษเพียงพอจริงหรือ?

หากคุณมีข้อสงสัยคล้าย ๆ กัน การปรากฏตัวของพิคาจูนี้ก็เพียงพอที่จะขจัดข้อสงสัยส่วนใหญ่ออกไปได้

ยกเว้นการสาธิตงานแถลงข่าวที่ไม่สามารถทำซ้ำได้ นี่อาจเป็นครั้งแรกที่ภาพสองมิติและโลกแห่งความเป็นจริงสามารถโต้ตอบกันได้อย่างกลมกลืนในการสร้างวิดีโอ AI

ในภาพ ภาพของปิกาจูตัวนี้เหมือนกับที่เราจำได้ในการ์ตูนทุกประการ แต่ปรากฏบนถนนที่พลุกพล่านจริงๆ แล้วกระโดดเข้าไปในอ้อมแขนของน้องชายคนเล็ก

นี่คือข้อความแจ้งที่จำเป็นสำหรับวิดีโอนี้:

กล้องหน้าตรงกลาง: พิคาชูยืนอยู่บนถนนในเมืองที่พลุกพล่าน ข้างแบ็คแพ็คเกอร์เดินผ่านกล้อง ส่วนพิคาชูก็วิ่งจากด้านหลัง กระโดดเข้าไปในอ้อมแขนของแบ็คแพ็คเกอร์ พิคาชูกอดคอของเขาอย่างมีความสุขและเข้ามาใกล้มาก คนเดินเท้ารีบ และแบ็คแพ็คเกอร์ก็อุ้มพิคาชูไปข้างหน้า ซึ่งแก้มของเขาเปล่งประกายด้วยความตื่นเต้น ทำให้ช่วงเวลานั้นสว่างขึ้น มีเสน่ห์และไม่ต้องใช้ความพยายาม

ในปี 1934 "Hollywood Party" ซึ่งอำนวยการสร้างโดย MGM การแสดงของจิมมี่ ดูแรนท์ในการถือ "มิกกี้เมาส์" กลายเป็นฉากคลาสสิกฉากแรกในประวัติศาสตร์ภาพยนตร์โลกที่ผสมผสานการ์ตูนและภาพจริงเข้าด้วยกัน 90 ปีต่อมา เอฟเฟ็กต์นี้เต็มรูปแบบ ความฉลาดแต่ยุ่งยากอย่างยิ่งในการนำไปใช้ ในที่สุด AI ก็สามารถทำได้

สิ่งที่น่าประหลาดใจคือพิคาชูสร้างโดย AI และโลกแห่งความเป็นจริงที่พิคาชูอาศัยอยู่ก็สร้างโดย AI เช่นกัน เมื่อพิจารณาจากเอฟเฟกต์ Pixverse V3 มีความเข้าใจแอนิเมชั่นที่เข้าสู่โลกแห่งความเป็นจริงได้อย่างราบรื่น

ไม่เพียงแต่ปิกาจูเท่านั้น คุณยังสามารถใช้ข้อความต่อไปนี้ซึ่งดูเหมือนว่าจะมีองค์ประกอบมากเกินไป เพื่อสร้างวิดีโอที่ลุงมาริโอกำลังเข้าไปในสถานีรถไฟ:

วิดีโอดังกล่าวแสดงให้เห็นสถานีรถไฟที่พลุกพล่านซึ่งเต็มไปด้วยผู้โดยสารหลากหลายกลุ่มที่รอรถไฟอย่างกระตือรือร้น กล้องกวาดไปทั่วฉาก และจับภาพบรรยากาศที่มีชีวิตชีวาของซูเปอร์มาริโอ ตัวละครอ้วนชาวอิตาลีที่มีใบหน้ากลม สวมหมวกสีแดงอันเป็นเอกลักษณ์ของเขา และ ชุดเอี๊ยมสีน้ำเงิน กล้องติดตามมาริโออย่างใกล้ชิดขณะที่เขาก้าวขึ้นไปบนเวทีอย่างมั่นใจ ใบหน้าของเขายิ้มแย้มแจ่มใสด้วยความตื่นเต้น... วิดีโออยู่ในรูปแบบที่สมจริง
ในวิดีโอ สถานีรถไฟเต็มไปด้วยผู้โดยสารทุกประเภทที่รอรถไฟอย่างใจจดใจจ่อ กล้องแพนไปทั่วฉากเพื่อเก็บภาพบรรยากาศที่มีชีวิตชีวา ขณะที่รถไฟเข้าใกล้ชานชาลาอย่างช้าๆ กล้องก็ติดตามซูเปอร์มาริโอตัวละครชาวอิตาลีร่างสูงสวมหมวกสีแดงอันเป็นเอกลักษณ์และชุดเอี๊ยมสีน้ำเงิน เขาเดินขึ้นไปบนชานชาลาอย่างมั่นใจด้วยรอยยิ้มที่ตื่นเต้น รูปแบบของวิดีโอมีความสมจริงมาก

มีตัวเอกที่โดดเด่นคือมาริโอในภาพ ฝูงชนที่พลุกพล่านอยู่ข้างหลังเขาแต่ละคนมีรายละเอียดการเคลื่อนไหวของเขาที่แตกต่างกัน ขณะที่มาริโอเดินไปข้างหน้าตามกล้อง ขอบที่ตัวละครที่เคลื่อนไหวตัดกันกับสภาพแวดล้อมจริงก็ได้รับการจัดการอย่างชัดเจนเช่นกัน และสะอาดหมดจด ขณะเดียวกัน รถไฟก็เคลื่อนเข้าสู่สถานีด้วย

หากตัวการ์ตูนไม่สามารถสนองความอยากของคุณได้ เรามาดูกันว่า PixVerse V3 ทำงานอย่างไรในฉากใหญ่ๆ กัน

——คำสำคัญ: มังกรผล็อยหลับไป

พรอมต์ที่สมบูรณ์เป็นดังนี้:

Steadycam ติดตามภาพมังกรที่กำลังดำดิ่งลงไปในน้ำ พระสงฆ์ยกแขนขึ้นแสดงความขอบคุณ
การติดตาม Steadicam: มังกรดำลงไปในน้ำและพระก็ยกแขนขึ้นแสดงความขอบคุณ

แม้ว่าวิดีโอจะยังขาดรายละเอียดบางส่วนที่กล่าวถึงใน Prompt แต่โดยรวมแล้วไม่ว่าจะเป็นความสม่ำเสมอของการเคลื่อนไหวของกล้อง การใช้โทนสีมืดมนเพื่อแสดงความตึงเครียดของภาพอย่างละเอียด การใช้สัตว์ประหลาดในระยะไกลและถูกทอดทิ้ง รถยนต์ที่อยู่เบื้องหน้า ความสามารถในการสร้างวิดีโอของ PixVerse V3 เริ่มเข้าใกล้คุณภาพของภาพระดับภาพยนตร์แล้ว

นอกจากวิดีโอของ Vincent แล้ว คราวนี้ PixVerse V3 ยังแสดงให้เห็นถึงความสามารถด้านวิดีโอแบบรูปภาพที่ยอดเยี่ยมอีกด้วย

วิดีโอของ Tusheng เต็มไปด้วยจินตนาการ คุณสามารถลองค้นหาโปสเตอร์หนังอเมริกันตะวันตกสุดหล่อ เพิ่มข้อความแจ้ง และปล่อยให้เขาทำสิ่งที่ "อุกอาจ" เช่น การเผชิญหน้ากับปืนพกคุณภาพต่ำ

พรอมต์เป็นเช่นนี้:

พรอมต์ที่สมบูรณ์เป็นดังนี้:

ปืนพกมีควันดำพุ่งเข้าใส่ ทำให้ใบหน้าของชายคนนั้นสกปรก
ปืนพกยิงผิดและมีควันดำออกมา ทำให้ใบหน้าของชายคนนั้นเปื้อน

ความรู้สึกที่แตกต่างที่สุดของ PixVerse V3 ในแง่ของความสามารถด้านวิดีโอ Wensheng และ Tusheng ก็คือมันอยู่ใกล้กับจุดสนใจในชีวิตประจำวันของคนทั่วไปอย่างมาก ในความเป็นจริง ยกเว้นผู้ปฏิบัติงานที่เกี่ยวข้องกับการสร้างสรรค์วิดีโอระดับมืออาชีพ มีเพียงไม่กี่คนที่จำเป็นต้องใช้ซอฟต์แวร์วิดีโอ AI เพื่อแกะสลักงานภาพยนตร์และโทรทัศน์ที่สมบูรณ์แบบ ในทางตรงกันข้าม ผู้คนจำนวนมากขึ้นที่เพิ่งใช้ความสามารถในการสร้างวิดีโอมีความสงสัยว่าความสามารถนี้สามารถเล่นกับโลกแห่งความเป็นจริงหรือแม้แต่กับตัวเองได้หรือไม่ ตัวอย่างเช่น คุณสามารถแนะนำตัวการ์ตูนที่คุณชื่นชอบในสถานที่ที่คุณออกไปข้างนอกทุกวัน หรือแม้แต่เปลี่ยนตัวเองให้เป็นตัวการ์ตูนอย่างไอรอนแมน

ปัญหาหลายประการที่พบในผลิตภัณฑ์วิดีโอ AI ในปัจจุบันเกิดจากการที่ติดอยู่กับการส่งเสริมความสามารถด้านเทคนิคด้วยตนเอง และผู้ใช้ก็หายไป ในขั้นตอนนี้เมื่อเทคโนโลยีวิดีโอของ Vincent เพิ่งเกิดขึ้น สิ่งที่คนทั่วไปส่วนใหญ่อาจชอบคือผลิตภัณฑ์วิดีโอ AI ที่อยู่ใกล้กับพวกเขาและเป็นมิตรมากพอ

จากมุมมองนี้ PixVerse V3 ในปัจจุบันอาจเป็นผลิตภัณฑ์ที่คาดเดาความคิดของผู้ใช้ได้แม่นยำที่สุด

ความน่าทึ่งของ PixVerse V3 ไม่เพียงแต่เกิดจากความสามารถในการทำซ้ำของโมเดลวิดีโอ AI ขนาดใหญ่ที่อยู่เบื้องหลัง PixVerse V3 เท่านั้น แต่ยังเพิ่มประสิทธิภาพของความสามารถในการทำความเข้าใจคำที่รวดเร็วอีกด้วย ฉันเชื่อว่าผู้คนที่ระมัดระวังจะสังเกตเห็นสิ่งนี้หลังจากเห็นตัวอย่างแจ้งข้างต้น

"หัวเรื่อง + คำอธิบายหัวเรื่อง + การเคลื่อนไหว + สภาพแวดล้อม" เป็นสูตรพร้อมท์ที่เพิ่มประสิทธิภาพสูงสุดของการสร้างวิดีโอ AI เมื่อเปรียบเทียบกับเวอร์ชัน 2.5 คุณสามารถเพิ่มมิติ "คำอธิบายช็อต" ให้กับ PixVerse V3 ได้แล้ว

แน่นอนว่า นอกเหนือจากการปฏิบัติตามสูตรนี้แล้ว Prompt ยังต้องอธิบายการกระทำของตัวละครอย่างละเอียดที่สุดเท่าที่จะเป็นไปได้ และหลีกเลี่ยงคำอธิบายที่ง่ายเกินไป

ในเวลาเดียวกัน PixVerse V3 ยังมีตัวเลือกวิดีโอเอาต์พุตที่หลากหลายยิ่งขึ้น ในแง่ของรูปแบบวิดีโอเอาต์พุต PixVerse V3 รองรับอัตราส่วนวิดีโอที่หลากหลาย รวมถึง 16:9, 9:16, 3:4, 4:3 และ 1 :1 ฟังก์ชันการจัดรูปแบบได้รับการอัปเกรดหลังจากการอัปเดตเวอร์ชันนี้แล้ว ขณะนี้โหมดทั้งสองของ Vincent Video และ Tusheng Video รองรับตัวเลือกสี่สไตล์ ได้แก่ แอนิเมชั่น ความเป็นจริง ดินเหนียว และ 3D

พูดง่ายๆ ก็คือ PixVerse V3 ไม่เพียงแต่แข็งแกร่งขึ้นในครั้งนี้เท่านั้น แต่ยังต้องการใส่คำอธิบายผลิตภัณฑ์ไว้ในมือของคุณทีละบรรทัดอีกด้วย

บนแพลตฟอร์มโซเชียล X ผู้ติดตามผลิตภัณฑ์ AI จำนวนมากได้เริ่มใช้ PixVerse V3 เช่น Pierrick Chevallier ซึ่งมีแฟน ๆ มากมาย เขายังรวบรวมโพสต์เฉพาะเพื่อแสดงวิดีโอที่เขาสร้างโดยใช้ PixVerse V3 นอกเหนือจากความสามารถในการสร้างอันทรงพลังของเขาแล้ว สิ่งที่สะดุดตาก็คือเขาแสดงวิดีโอ "กลิ่นวันฮาโลวีน" มากมาย

วันฮาโลวีนนี้ ให้ PixVerse V3 ทำ “เอฟเฟกต์”

เพื่อที่จะเจาะกลุ่มผลิตภัณฑ์วิดีโอ AI ที่น่าสนใจเพียงพอ นอกเหนือจากการสนับสนุนทางเทคนิคที่เพียงพอแล้ว ยังต้องการโอกาสที่ดีอีกด้วย เมื่อพูดถึงเรื่องนี้ การเปิดตัว PixVerse V3 ก็มาในเวลาที่เหมาะสม

วันที่ 1 พฤศจิกายนเป็นวันฮาโลวีน และช่วงเวลานี้ในช่วงปลายเดือนตุลาคมเป็นช่วงสูงสุดของจินตนาการประจำปีสำหรับคนหนุ่มสาว ร่วมกับธีมฮาโลวีน PixVerse V3 ได้เปิดตัวซีรีส์เทมเพลตธีมฮาโลวีน ซึ่งช่วยให้คุณสามารถใช้ AI เพื่อ "เสกคาถา" กับทุกสิ่งรอบตัวคุณ

ในครั้งนี้มีเทมเพลตธีมฮาโลวีนทั้งหมด 8 แบบที่เปิดตัวใน PixVerse V3 โดยหนึ่งในนั้นเน้นที่ "การเปลี่ยนแปลงไปสู่บุคคลที่มีชีวิต"

ตัวอย่างเช่น สัตว์ประหลาดปรากฏตัวออกมาจากที่ไหนสักแห่งในเมือง

นอกจากฉากใหญ่ๆ แล้ว PixVerse V3 ยังสามารถสร้างองค์ประกอบในภาพถ่ายที่ "มีชีวิต" ได้โดยตรง เช่น ทำให้ลูกสุนัขใน "I'm Waiting for You in the Rain" เดินออกจากภาพอย่างแท้จริง:

ลูกสุนัขมีการเคลื่อนไหวตามธรรมชาติด้วยการเงยศีรษะก่อนลุกขึ้นยืน หลังจากเดินออกจากภาพ ภาพต้นฉบับเหลือเพียงสนามหญ้าอันเงียบสงบ และเอฟเฟ็กต์ทั้งหมดก็น่าทึ่งมาก

เทมเพลตนี้ยังมีรูปแบบการเล่นที่เหนือจินตนาการอีกด้วย ตัวอย่างเช่น วิทรูเวียนแมนในผลงานของเลโอนาร์โด ดา วินชี สามารถได้รับอนุญาตให้ออกมาจากวงกลมที่ตีกรอบเขาได้หรือไม่

บางสิ่งเช่นนี้:

ความสามารถในการแสดงในวันฮัลโลวีนก็เพียงพอแล้วที่จะทำให้ผู้ชมประหลาดใจ

คราวนี้ เทมเพลตประเภทที่สองที่ PixVerse V3 จัดทำขึ้นสำหรับวันฮาโลวีนจะใช้เส้นทางแบบนามธรรม

เช่น ปล่อยให้กล่องเหล็กยืนขึ้นแล้ววิ่งหนีไป:

หรือทุบรถปอร์เช่เป็นชิ้น ๆ แล้วเปลี่ยนให้เป็นกอง:

แน่นอนว่า คราวนี้เทมเพลตของ PixVerse V3 ยังมีเอฟเฟกต์เหมือนวันฮาโลวีนอีกมากมายที่สามารถเล่นได้ เช่น การสวมหมวกพ่อมดบนรูปถ่ายตัวละครแล้วขยับมัน เช่นนี้

เทมเพลตฮาโลวีนเหล่านี้รวมอยู่ในฟีเจอร์เอฟเฟกต์ใหม่ของ PixVerse V3 มันใช้งานง่ายมาก หลังจากอัปโหลดภาพแล้ว ให้เลือกเอฟเฟกต์ที่คุณต้องการแล้วคลิกเพื่อสร้างมันขึ้นมา ไม่ต้องกังวลกับการป้อนข้อความแจ้งตรงกลาง

คราวนี้ PixVerse V3 แสดงให้เห็นถึงความสามารถในการสร้างหลายรูปแบบที่แข็งแกร่งขึ้น จากวิดีโอ Wensheng และวิดีโอ Tusheng ของตัวเอง ตอนนี้ PixVerse V3 สามารถทำให้วิดีโอที่สร้างขึ้นมีเนื้อหาเสียงที่ผู้ใช้ต้องการได้ และหากวิดีโอต้นฉบับไม่นานพอ ตอนนี้ PixVerse V3 มีความสามารถในการสร้างความต่อเนื่องของวิดีโอต้นฉบับเพิ่มเติม

ความสามารถในการสร้างหลายรูปแบบเหล่านี้ได้กลายเป็นคุณสมบัติใหม่สองประการที่เปิดตัวใน PixVerse V3 พร้อมด้วยเอฟเฟกต์ ฟังก์ชั่นแรกคือ Lipsync ซึ่งเป็นฟังก์ชั่นลิปซิงค์ที่สามารถสร้างเสียงที่ซิงโครไนซ์ของตัวละครหลายภาษาสำหรับวิดีโอ

ฟังก์ชั่น Lipsync ช่วยให้ผู้ใช้สามารถป้อนการเขียนคำโฆษณาของตนเองหรืออัปโหลดไฟล์เสียงตามวิดีโอที่สร้างขึ้น จากนั้น PixVerse จะปรับรูปปากของตัวละครในวิดีโอโดยอัตโนมัติตามการเขียนคำโฆษณาหรือเนื้อหาไฟล์เสียง ปัจจุบัน Lipsync รองรับวิดีโอความยาว 30 วินาที และภาษาที่สามารถลิปซิงค์ได้ ได้แก่ อังกฤษ จีน ฝรั่งเศส และญี่ปุ่น

ฟังก์ชั่นอีกอย่างหนึ่งคือการขยายวิดีโอหรืออาจเข้าใจได้ว่าเป็นเรื่องราวต่อเนื่อง

เพื่อตอบสนองต่อปัญหาความยาวของวิดีโอที่สร้างในปัจจุบันสั้นเกินไป ใน PixVerse V3 ผู้ใช้สามารถเลือกวิดีโอที่สร้างขึ้น คลิกปุ่ม "ขยาย" ป้อนคำพร้อมท์ที่เกี่ยวข้องกับวิธีพัฒนาวิดีโอเพิ่มเติม คลิก "สร้าง" และวิดีโอต้นฉบับจะเป็น ทิศทางที่นำเสนอบรรลุความก้าวหน้าของโครงเรื่องในขณะที่ยังคงรักษาความสอดคล้องกันในระดับสูงระหว่างตัวละครและการกระทำ

ด้วยการเพิ่มความสามารถในการสร้างวิดีโอแบบหลายรูปแบบ PixVerse V3 สามารถสร้างวิดีโอ AI ที่มีการเล่าเรื่องที่ใหญ่ขึ้นและเอฟเฟกต์ภาพและเสียงที่ดีขึ้น และขอบเขตของการสร้างวิดีโอ AI ก็กว้างขึ้นอีกด้วย

สร้างผลิตภัณฑ์วิดีโอ AI ที่สามารถเล่นได้อย่างแท้จริง

"ช่วงเวลาของ ChatGPT คือช่วงเวลาที่ผู้ใช้ทั่วไปสามารถใช้งานได้" Wang Changhu ผู้ก่อตั้งและซีอีโอของ Aishi Technology กล่าวในการให้สัมภาษณ์เมื่อเดือนเมษายนปีนี้

ในช่วงสองปีที่ผ่านมา แสงแวววาวใหม่ๆ ของเทคโนโลยีแบบจำลองขนาดใหญ่ทั้งหมดได้ถูกเปลี่ยนให้กลายเป็นเรื่องราวอันยิ่งใหญ่ใหม่เกี่ยวกับวิธีการผลิต ราวกับว่าชีวิตมนุษย์จะถูกทำลายล้างไปโดยสิ้นเชิงในช่วงเวลาอันสั้น แต่จนถึงขณะนี้สิ่งนี้ยังไม่เกิดขึ้น

ในเวลาเดียวกัน ความตื่นเต้นที่ Sora นำมาและจินตนาการทางเทคนิคที่ทะเยอทะยานมากเกินไป ได้ค่อยๆ ทำให้ผลิตภัณฑ์วิดีโอ AI ในด้านต่างๆ หมดความสนใจและไม่เกี่ยวข้องกับชีวิตสาธารณะเลย ดังนั้นในอีกด้านหนึ่ง ผลิตภัณฑ์วิดีโอ AI เช่น Runway ที่ถูกวางตำแหน่งเป็นเครื่องมือระดับมืออาชีพ จึงยากที่จะแยกออกจากวงจรเนื่องจากมีเกณฑ์การใช้งานสูง ในทางกลับกัน ผลิตภัณฑ์ที่วางตำแหน่งไปทางทั่วไปมากกว่า ประชาชนตกอยู่ในภาวะที่กลืนไม่เข้าคายไม่ออกหลังจากทุกคนพยายามใช้ หลังจากความแปลกใหม่หมดลง เป็นการยากที่จะรักษาผลิตภัณฑ์ไว้ ดังนั้นจึงไม่มีทางเลือกอื่นนอกจากจมลงไป ตรรกะง่ายๆ ของ "การกรอง" และ "เอฟเฟกต์พิเศษ"

กล่าวอีกนัยหนึ่ง ความสามารถในการสร้าง AI ที่เปิดกว้างอย่างมากทำให้ผลิตภัณฑ์เกือบทั้งหมดในปัจจุบันในด้านวิดีโอ AI ดูเหมือนผลิตภัณฑ์กึ่งสำเร็จรูปบางประเภท ความสุ่มและไม่สามารถควบคุมได้ของเนื้อหาที่สร้างขึ้นนั้นถูกบรรจุเป็นประสบการณ์ใหม่ ซึ่งก็หมายถึงเช่นกัน ว่าใช้งานภาคสนามได้ยาก

เช่นเดียวกับที่โลกภายนอกประหลาดใจกับความสามารถในการสร้างมนุษย์บอลลูนของ Sora Patrick Cederberg ก็ประสบปัญหากับการขาดความสม่ำเสมอในการสร้างเนื้อหาของ Sora เขาบ่นว่าสีของลูกโป่งจะเปลี่ยนไปในแต่ละรุ่น และความไม่สมบูรณ์นี้มีความหมายอย่างมาก ของงานหลังการผลิตยังคงหลีกเลี่ยงไม่ได้ มีปัญหาที่คล้ายกันมากมาย ซึ่งเป็นสาเหตุที่แม้ว่าฮอลลีวูดจะเริ่มโจมตีเมื่อปีที่แล้วเนื่องจากการหยุดชะงักของอุตสาหกรรมภาพยนตร์เนื่องจากนางแบบรายใหญ่ หนึ่งปีต่อมาโซระยังคงไม่สามารถเข้าสู่ขั้นตอนการทำงานของภาพยนตร์และโทรทัศน์ได้จริงๆ

ในปัจจุบัน ผลิตภัณฑ์วิดีโอ AI ติดอยู่ในสถานการณ์ที่คล้ายกันไม่มากก็น้อย - แม้ว่าความสามารถในการสร้างวิดีโอ AI จะสร้างความตื่นเต้นให้กับทุกคนมาเป็นเวลานาน แต่ผลิตภัณฑ์สร้างวิดีโอ AI ยังคงเป็น "การแสดงของผู้ขาย" ที่ดูสวยงาม”

เมื่อเผชิญกับกระแสเทคโนโลยีใหม่ เป็นเรื่องยากที่ผลิตภัณฑ์จะยังคง "เป็นรูปธรรม" อย่างไรก็ตาม สิ่งที่ Aishi Technology ได้ส่งมอบจากเวอร์ชันเว็บ PixVerse ดั้งเดิมไปยัง PixVerse V3 ในปัจจุบันนั้นเป็นเส้นทางการวนซ้ำที่ชัดเจนและเป็นระเบียบซึ่งหาได้ยาก

ในเดือนมกราคมของปีนี้ Aishi Technology ได้เปิดตัว PixVerse เวอร์ชันเว็บอย่างเป็นทางการ ซึ่งเป็นผลิตภัณฑ์วิดีโอ PixVerse แต่ในเวลานั้น รวมถึง PixVerse ด้วย ปัญหาที่พบในผลิตภัณฑ์วิดีโอ Wensheng เกือบทั้งหมดก็คือรูปภาพที่สร้างขึ้นนั้นไม่สามารถควบคุมได้ ซึ่งหมายความว่าผู้ใช้ไม่สามารถสร้างเนื้อหาวิดีโอโดยใช้อักขระที่เป็นหนึ่งเดียวได้อย่างต่อเนื่อง สามเดือนต่อมา เวอร์ชันเว็บ PixVerse ได้รับการติดตั้งฟังก์ชัน C2V (ตัวละครเป็นวิดีโอ) ที่พัฒนาขึ้นจากโมเดลวิดีโอขนาดใหญ่ที่พัฒนาขึ้นเอง ซึ่งในตอนแรกได้แก้ไขปัญหาความสอดคล้องในการสร้างวิดีโอ AI ด้วยการแยกคุณสมบัติอักขระอย่างแม่นยำเพื่อล็อคตัวละคร

หลังจากแก้ไข "บทบาท" ในวิดีโอแล้ว PixVerse มุ่งเน้นไปที่การทำซ้ำในภายหลังเกี่ยวกับ "ความสามารถในการควบคุม" ของพฤติกรรมในเนื้อหาที่สร้างขึ้น ในเดือนมิถุนายนของปีนี้ Aishi Technology ได้เปิดตัว Magic Brush Motion Brush ผู้ใช้สามารถควบคุมการเคลื่อนไหวและทิศทางของแต่ละองค์ประกอบได้อย่างแม่นยำเพียงแค่ทาบนองค์ประกอบในหน้าจอวิดีโอ PixVerse V2 เปิดตัวเมื่อปลายเดือนกรกฎาคม นอกเหนือจากการแสดงการควบคุมเนื้อหาที่สร้างขึ้นอย่างเพียงพอแล้ว ความยากในการแจ้งยังลดลงอย่างมาก ในเวลาเดียวกัน วิธีปรับแต่งเอฟเฟกต์ที่สร้างขึ้นก็มีมากมายมากขึ้น

นี่เป็นการทำซ้ำอีกครั้งด้วยความตั้งใจที่ชัดเจนมาก - "จำเป็นต้องลองใช้รูปแบบผลิตภัณฑ์เฉพาะ แต่ท้ายที่สุดแล้ว เรายังคงหวังว่าจะให้บริการผู้ใช้ทั่วไปส่วนใหญ่" ดังที่ Wang Changhu กล่าวในการสัมภาษณ์ครั้งก่อน

เมื่อความสามารถในการสร้างวิดีโอไม่สามารถตอบสนองความต้องการของผู้ใช้ทั่วไปได้โดยตรง การให้บริการผู้สร้างมืออาชีพและการพัฒนาเครื่องมือรุ่นต่อไปตามกระบวนทัศน์การสร้างเนื้อหาใหม่จึงมีความสำคัญสูงกว่า “เมื่อเทคโนโลยีรวมปัจจัยการผลิตไว้ด้วย เช่น AI จะเข้ามาแทนที่นักแสดง ฉาก และกล้องในระหว่างการถ่ายทำ ความสามารถในการสร้างวิดีโอ AI ก็สามารถเริ่มนำไปใช้โดยสาธารณะได้ และกลุ่มผู้ใช้ก็จะค่อยๆ ขยายออก ทำให้เกิดโอกาสมหาศาล "

คราวนี้ PixVerse 3V เริ่มพยายามแนะนำการเล่นเกมที่เกี่ยวข้องกับชีวิตของคนธรรมดามากขึ้น และพยายามใช้ Prompt เพื่อตั้งค่าเลนส์ ส่วนหลังถือได้ว่าเป็นความพยายามที่จะเปลี่ยนกล้องบางส่วน จากมุมมองนี้ Aishi Technology ได้อยู่บนเส้นทางที่มุ่งมั่นอย่างมากในการขัดเกลาทิศทางผลิตภัณฑ์ของตน

ในคลื่นเทคโนโลยีแห่งการสร้างวิดีโอ AI ซึ่งความแตกต่างคือความงดงาม ทางเลือกของ Aishi Technology คือการสวนทางกับเทรนด์โดยรวม หลีกหนีจากเรื่องเล่าที่ยิ่งใหญ่ และจัดทำแผนเฉพาะเจาะจงที่สุดสำหรับวิธีการเล่นผลิตภัณฑ์วิดีโอ AI

เฉพาะเมื่อผู้คนสามารถถือมันไว้ในมือและเล่นกับมันให้ได้มากที่สุดเท่านั้น แอปพลิเคชันวิดีโอ AI สามารถเปลี่ยนจาก "การแสดงผู้ขาย" ที่นำโดยโซระเป็น "การแสดงของผู้ซื้อ" ที่มีชีวิตชีวาได้

การเปิดตัวอันน่าทึ่งของ PixVerse V3 อาจเป็นจุดเริ่มต้นของการเปลี่ยนแปลงเชิงบวกอีกครั้งเบื้องหลังวิดีโอ AI ที่ "เย็นลง" นี้