Beijing Zhipu Huazhang Technology Co., Ltd. merilis model dasar dan layanan aplikasi generasi baru pada 29 Agustus 2024, dan mendemonstrasikannya secara rinci pada konferensi KDD2024. Pembaruan ini mencakup berbagai modalitas seperti bahasa, gambar, dan video, serta meluncurkan aplikasi baru untuk pengguna C-end, menandai bahwa Zhipu telah membuat kemajuan signifikan di bidang kecerdasan buatan, dan kekuatan teknis serta kemampuan inovasinya telah semakin ditingkatkan. . Di bawah ini adalah penjelasan detail mengenai pembaruan ini.
Pada konferensi KDD2024, Zhipu merilis model dasar generasi baru termasuk model bahasa GLM-4-Plus, model grafik Vincent CogView-3-Plus, model pemahaman gambar/video GLM-4V-Plus, dan model pembuatan video CogVideoX. Model-model ini telah mencapai tingkat terdepan internasional di bidangnya masing-masing. Kinerja model GLM-4-Plus telah ditingkatkan secara komprehensif dalam hal pemahaman bahasa, mengikuti instruksi, dan pemrosesan teks panjang, dan setara dengan model tingkat pertama seperti GPT-4o. Model CogView-3-Plus menggunakan arsitektur Transformer untuk menggantikan arsitektur UNet tradisional, yang mengoptimalkan efek model, dan kinerjanya mendekati model lini pertama seperti MJ-V6 dan FLUX. Model GLM-4V-Plus memiliki kemampuan pemahaman gambar dan video berkualitas tinggi, sehingga menjadi model API pemahaman video umum domestik pertama. Setelah rilis versi 2B, model CogVideoX semakin membuka versi 5B, dengan peningkatan kinerja, menjadi pemimpin di antara model generasi video sumber terbuka saat ini. Selain itu, Zhipu meluncurkan layanan panggilan video pertama di Tiongkok untuk pengguna C-end di "Qingyan APP". Layanan ini mencakup mode teks, audio, dan video, serta memiliki kemampuan penalaran waktu nyata, memberikan pengalaman interaktif yang lancar kepada pengguna. Zhipu juga mengumumkan penggunaan gratis GLM-4-Flash API, yang memiliki keunggulan dalam kecepatan dan kinerja, memungkinkan pengguna membuat model dan aplikasi eksklusif dengan cepat dan gratis. Pada saat yang sama, untuk memenuhi kebutuhan pengguna yang berbeda, Zhipu menyediakan fungsi penyempurnaan model. Zhipu mengatakan pihaknya akan terus bergerak maju, membuat mesin berpikir seperti manusia dan menghadirkan teknologi dan layanan yang lebih maju kepada pengguna.
Selain itu, Zhipu meluncurkan layanan panggilan video pertama di Tiongkok untuk pengguna C-end di "Qingyan APP". Layanan ini mencakup mode teks, audio, dan video, serta memiliki kemampuan penalaran waktu nyata, memberikan pengalaman interaktif yang lancar kepada pengguna.
Zhipu juga mengumumkan penggunaan gratis GLM-4-Flash API, yang memiliki keunggulan dalam kecepatan dan kinerja, memungkinkan pengguna membuat model dan aplikasi eksklusif dengan cepat dan gratis. Pada saat yang sama, untuk memenuhi kebutuhan pengguna yang berbeda, Zhipu menyediakan fungsi penyempurnaan model.
Zhipu mengatakan pihaknya akan terus bergerak maju, membuat mesin berpikir seperti manusia dan menghadirkan teknologi dan layanan yang lebih maju kepada pengguna.
Pembaruan besar:
Model dasar bahasa GLM-4-Plus: Kinerjanya telah ditingkatkan secara komprehensif dalam hal pemahaman bahasa, mengikuti instruksi, dan pemrosesan teks panjang, mempertahankan tingkat terdepan internasional.
Model dasar diagram Vincent CogView-3-Plus: memiliki kinerja mendekati model terbaik saat ini seperti MJ-V6 dan FLUX.
Model Dasar Pemahaman Gambar/Video GLM-4V-Plus: Memiliki kemampuan pemahaman gambar yang sangat baik dan memiliki kemampuan pemahaman video berdasarkan persepsi waktu. Model ini akan diluncurkan pada platform terbuka (bigmodel.cn) dan menjadi API model pemahaman video umum pertama di Tiongkok.
Model dasar pembuatan video CogVideoX: Setelah versi 2B dirilis dan dijadikan sumber terbuka, versi 5B juga secara resmi menjadi sumber terbuka. Performanya semakin ditingkatkan dan merupakan pilihan terbaik di antara model pembuatan video sumber terbuka saat ini.
"Qingyan APP" meluncurkan panggilan video: layanan panggilan video domestik pertama yang terbuka untuk pengguna C-end. Fungsi panggilan video "Qingyan APP" mencakup mode teks, audio dan video, dan memiliki kemampuan penalaran waktu nyata.
GLM-4-Flash API: Layanan inferensi sepenuhnya gratis dan menyediakan layanan penyesuaian.
Tautan aplikasi layanan panggilan video:
https://zhipu-ai.feishu.cn/share/base/form/shrcnqpIx9q5ILEFeT2cPNhyuSf
Secara keseluruhan, pembaruan teknologi Zhipu Huazhang menunjukkan kekuatannya yang kuat dan kemampuan inovasi berkelanjutan di bidang kecerdasan buatan, menghadirkan teknologi dan layanan yang lebih maju kepada pengguna, dan memberikan vitalitas baru ke dalam pengembangan industri kecerdasan buatan.