Zhipu AI ได้เปิดตัว CogVideoX รุ่นสร้างวิดีโอเจเนอเรชั่นใหม่ ซึ่งมีหัวใจหลักในการเพิ่มประสิทธิภาพและคุณภาพของการสร้างวิดีโออย่างมีนัยสำคัญ ถือเป็นความก้าวหน้าครั้งสำคัญของบริษัทในด้านเทคโนโลยีหลายรูปแบบ CogVideoX ประสบความสำเร็จในนวัตกรรมมากมายในระดับเทคนิค และเปิดให้ผู้ใช้ใช้งานผ่านแพลตฟอร์ม Zhipu Qingyan ซึ่งให้บริการสร้างวิดีโอ AI ที่สะดวกสบาย และมอบอินเทอร์เฟซการเรียก API สำหรับองค์กรและนักพัฒนา
Zhipu AI ได้เปิดตัว CogVideoX รุ่นสร้างวิดีโอเจเนอเรชั่นใหม่ ซึ่งถือเป็นความก้าวหน้าที่สำคัญอีกประการหนึ่งของการพัฒนาเทคโนโลยีหลายรูปแบบของบริษัท
คุณสมบัติทางเทคนิคหลักของ CogVideoX ประกอบด้วย:
โครงสร้างการเข้ารหัสอัตโนมัติแบบแปรผันสามมิติ (3D VAE): โครงสร้างนี้พัฒนาขึ้นอย่างอิสระโดย Zhipu AI สามารถบีบอัดข้อมูลวิดีโอต้นฉบับให้เหลือ 2% ของขนาดต้นฉบับ ซึ่งช่วยลดต้นทุนและความยากในการฝึกอบรม เมื่อใช้ร่วมกับโมดูลการเข้ารหัสตำแหน่ง 3D RoPE จะปรับปรุงความสามารถในการจับภาพความสัมพันธ์ระหว่างเฟรมในมิติเวลา และสร้างการพึ่งพาในระยะยาวในวิดีโอ
โมเดลการทำความเข้าใจวิดีโอแบบครบวงจร: ช่วยเพิ่มความสามารถของโมเดลในการเข้าใจข้อความและปฏิบัติตามคำแนะนำ ทำให้มั่นใจได้ว่าวิดีโอที่สร้างขึ้นจะสอดคล้องกับความต้องการของผู้ใช้มากขึ้น และสามารถรองรับคำแนะนำที่ยาวเป็นพิเศษและซับซ้อนได้
สถาปัตยกรรม Transformer ที่รวมข้อความ เวลา และพื้นที่ในสามมิติ: Expert Block ได้รับการออกแบบอย่างสร้างสรรค์เพื่อจัดแนวช่องว่างของข้อความและวิดีโอ และปรับการโต้ตอบระหว่างรูปแบบต่างๆ ให้เหมาะสมผ่านกลไก Full Attention
โมเดล CogVideoX เปิดตัวแล้วบนพีซี แอปพลิเคชันมือถือ และมินิโปรแกรมของ Zhipu Qingyan ผู้ใช้สามารถสัมผัสประสบการณ์บริการวิดีโอที่สร้างด้วยข้อความ AI และรูปภาพได้ฟรีผ่านฟังก์ชัน "Ying" คุณสมบัติหลักของ Qingying ได้แก่ การสร้างอย่างรวดเร็ว ความสามารถในการติดตามคำสั่งที่มีประสิทธิภาพ การเชื่อมโยงเนื้อหา และความยืดหยุ่นในการกำหนดเวลาหน้าจอ
นอกจากนี้ bigmodel.cn ซึ่งเป็นแพลตฟอร์มแบบเปิดสำหรับโมเดลขนาดใหญ่ ยังได้ติดตั้ง "Qingying" อีกด้วย โดยองค์กรและนักพัฒนาสามารถใช้ฟังก์ชันต่างๆ ของตนผ่านการเรียก API Zhipu AI ได้ตรวจสอบประสิทธิผลของ Scaling Law ในด้านการสร้างวิดีโอ และจะยังคงขยายขนาดข้อมูลและขนาดโมเดลต่อไป และวิจัยสถาปัตยกรรมโมเดลใหม่เพื่อบีบอัดข้อมูลวิดีโอได้อย่างมีประสิทธิภาพมากขึ้น และผสานรวมเนื้อหาข้อความและวิดีโอให้ครอบคลุมมากขึ้น
ที่อยู่ประสบการณ์: https://top.aibase.com/tool/qingying-ai-shipinshengchengfuwu
การเปิดตัว CogVideoX ไม่เพียงแต่ช่วยให้ผู้ใช้ได้รับประสบการณ์การสร้างวิดีโอ AI ที่สะดวกสบายยิ่งขึ้นเท่านั้น แต่ยังบ่งชี้ว่าเทคโนโลยีการสร้างวิดีโอ AI จะนำพาไปสู่การพัฒนาขั้นใหม่อีกด้วย ในอนาคต Zhipu AI จะยังคงสำรวจสถาปัตยกรรมโมเดลขั้นสูงและโซลูชันทางเทคนิคต่อไป เพื่อส่งเสริมความก้าวหน้าอย่างต่อเนื่องของเทคโนโลยีการสร้างวิดีโอ AI