Beijing Zhipu Huazhang Technology Co., Ltd. เปิดตัวโมเดลพื้นฐานและบริการแอปพลิเคชันรุ่นใหม่เมื่อวันที่ 29 สิงหาคม 2024 และสาธิตอย่างละเอียดในการประชุม KDD2024 การอัปเดตนี้ครอบคลุมรูปแบบต่างๆ มากมาย เช่น ภาษา รูปภาพ และวิดีโอ และเปิดตัวแอปพลิเคชันใหม่สำหรับผู้ใช้ C-end ซึ่งแสดงให้เห็นว่า Zhipu มีความก้าวหน้าอย่างมากในด้านปัญญาประดิษฐ์ ตลอดจนจุดแข็งทางเทคนิคและความสามารถด้านนวัตกรรมได้รับการปรับปรุงให้ดียิ่งขึ้น . ด้านล่างนี้เป็นคำอธิบายโดยละเอียดของการอัปเดตนี้
ในการประชุม KDD2024 Zhipu ได้เปิดตัวโมเดลพื้นฐานรุ่นใหม่ รวมถึงโมเดลภาษา GLM-4-Plus, โมเดลกราฟ Vincent CogView-3-Plus, โมเดลการทำความเข้าใจรูปภาพ/วิดีโอ GLM-4V-Plus และโมเดลการสร้างวิดีโอ CogVideoX. โมเดลเหล่านี้ก้าวขึ้นสู่ระดับชั้นนำระดับนานาชาติในสาขาของตน ประสิทธิภาพของรุ่น GLM-4-Plus ได้รับการปรับปรุงอย่างครอบคลุมในแง่ของความเข้าใจภาษา การปฏิบัติตามคำสั่ง และการประมวลผลข้อความขนาดยาว และทัดเทียมกับโมเดลระดับแรก เช่น GPT-4o รุ่น CogView-3-Plus ใช้สถาปัตยกรรม Transformer เพื่อแทนที่สถาปัตยกรรม UNet แบบดั้งเดิม ซึ่งจะปรับเอฟเฟ็กต์ของโมเดลให้เหมาะสม และประสิทธิภาพก็ใกล้เคียงกับโมเดลบรรทัดแรก เช่น MJ-V6 และ FLUX รุ่น GLM-4V-Plus มีความสามารถในการทำความเข้าใจรูปภาพและความเข้าใจวิดีโอคุณภาพสูง กลายเป็น API โมเดลทำความเข้าใจวิดีโอทั่วไปในประเทศตัวแรก หลังจากการเปิดตัวเวอร์ชัน 2B โมเดล CogVideoX ได้เปิดเวอร์ชัน 5B เพิ่มเติมด้วยประสิทธิภาพที่ได้รับการปรับปรุง กลายเป็นผู้นำในโมเดลการสร้างวิดีโอโอเพ่นซอร์สในปัจจุบัน นอกจากนี้ Zhipu ยังได้เปิดตัวบริการวิดีโอคอลครั้งแรกของจีนสำหรับผู้ใช้ C-end บน "Qingyan APP" บริการนี้ครอบคลุมทั้งโหมดข้อความ เสียง และวิดีโอ และมีความสามารถในการให้เหตุผลแบบเรียลไทม์ ทำให้ผู้ใช้ได้รับประสบการณ์การโต้ตอบที่ราบรื่น นอกจากนี้ Zhipu ยังประกาศใช้ GLM-4-Flash API ฟรี ซึ่งมีข้อได้เปรียบในด้านความเร็วและประสิทธิภาพ ทำให้ผู้ใช้สามารถสร้างโมเดลและแอปพลิเคชันพิเศษได้อย่างรวดเร็วและฟรี ในเวลาเดียวกัน เพื่อตอบสนองความต้องการของผู้ใช้ที่แตกต่างกัน Zhipu จึงมีฟังก์ชันการปรับแต่งโมเดลอย่างละเอียด Zhipu กล่าวว่าจะยังคงเดินหน้าต่อไป ทำให้เครื่องจักรคิดได้เหมือนมนุษย์ และนำเทคโนโลยีและบริการขั้นสูงมาสู่ผู้ใช้
นอกจากนี้ Zhipu ยังได้เปิดตัวบริการวิดีโอคอลครั้งแรกของจีนสำหรับผู้ใช้ C-end บน "Qingyan APP" บริการนี้ครอบคลุมทั้งโหมดข้อความ เสียง และวิดีโอ และมีความสามารถในการให้เหตุผลแบบเรียลไทม์ ทำให้ผู้ใช้ได้รับประสบการณ์การโต้ตอบที่ราบรื่น
นอกจากนี้ Zhipu ยังได้ประกาศการใช้งาน GLM-4-Flash API ฟรี ซึ่งมีข้อได้เปรียบในด้านความเร็วและประสิทธิภาพ ทำให้ผู้ใช้สามารถสร้างโมเดลและแอปพลิเคชันพิเศษได้อย่างรวดเร็วและฟรี ในเวลาเดียวกัน เพื่อตอบสนองความต้องการของผู้ใช้ที่แตกต่างกัน Zhipu จึงมีฟังก์ชันการปรับแต่งโมเดลอย่างละเอียด
Zhipu กล่าวว่าจะยังคงเดินหน้าต่อไป ทำให้เครื่องจักรคิดได้เหมือนมนุษย์ และนำเทคโนโลยีและบริการขั้นสูงมาสู่ผู้ใช้
การอัปเดตที่สำคัญ:
รุ่นฐานภาษา GLM-4-Plus: ประสิทธิภาพได้รับการปรับปรุงอย่างครอบคลุมทั้งในด้านความเข้าใจภาษา การปฏิบัติตามคำแนะนำ และการประมวลผลข้อความขนาดยาว โดยยังคงรักษาระดับชั้นนำระดับสากล
Vincent แผนภาพฐานรุ่น CogView-3-Plus: มีประสิทธิภาพใกล้เคียงกับรุ่นที่ดีที่สุดในปัจจุบัน เช่น MJ-V6 และ FLUX
ความเข้าใจภาพ/วิดีโอรุ่นพื้นฐาน GLM-4V-Plus: มีความสามารถในการทำความเข้าใจภาพที่ยอดเยี่ยม และมีความสามารถในการทำความเข้าใจวิดีโอตามการรับรู้เวลา โมเดลดังกล่าวจะเปิดตัวบนแพลตฟอร์มแบบเปิด (bigmodel.cn) และกลายเป็น API โมเดลการทำความเข้าใจวิดีโอทั่วไปตัวแรกในจีน
CogVideoX รุ่นพื้นฐานสำหรับการสร้างวิดีโอ: หลังจากเวอร์ชัน 2B เปิดตัวและเปิดแหล่งที่มาแล้ว เวอร์ชัน 5B ก็ได้รับการปรับปรุงอย่างเป็นทางการเช่นกัน
"Qingyan APP" เปิดตัววิดีโอคอล: บริการวิดีโอคอลในประเทศรายแรกที่เปิดให้ผู้ใช้ C-end ฟังก์ชันวิดีโอคอลของ "Qingyan APP" ครอบคลุมโหมดข้อความ เสียง และวิดีโอ และมีความสามารถในการให้เหตุผลแบบเรียลไทม์
GLM-4-Flash API: บริการอนุมานเป็นบริการฟรีและให้บริการปรับแต่งอย่างละเอียด
ลิงค์แอปพลิเคชันบริการวิดีโอคอล:
https://zhipu-ai.feishu.cn/share/base/form/shrcnqpIx9q5ILEFeT2cPNhyuSf
โดยรวมแล้ว การอัปเดตทางเทคโนโลยีของ Zhipu Huazhang แสดงให้เห็นถึงความแข็งแกร่งและความสามารถด้านนวัตกรรมอย่างต่อเนื่องในด้านปัญญาประดิษฐ์ นำเทคโนโลยีและบริการขั้นสูงมาสู่ผู้ใช้ และอัดฉีดพลังใหม่ ๆ ให้กับการพัฒนาอุตสาหกรรมปัญญาประดิษฐ์