Pada akhir tahun, Beijing Zhipu Huazhang Technology Co., Ltd. meluncurkan versi pertama GLM-Zero, model inferensi pertama yang dilatih berdasarkan teknologi pembelajaran penguatan yang diperluas - GLM-Zero-Preview. Model ini telah menunjukkan kemampuan luar biasa dalam logika matematika, penulisan kode, dan penalaran masalah yang kompleks, dan telah mencapai hasil yang sebanding dengan model OpenAI serupa dalam berbagai evaluasi otoritatif. GLM-Zero-Preview tidak hanya meningkatkan kemampuan tugas ahli, namun juga mempertahankan kinerja luar biasa pada tugas-tugas umum, menetapkan tolok ukur baru untuk peningkatan kemampuan penalaran kecerdasan buatan.
Pada akhir tahun untuk Beijing Zhipu Huazhang Technology Co., Ltd., perusahaan tersebut merilis model inferensi pertamanya yang dilatih berdasarkan teknologi pembelajaran penguatan yang diperluas - versi pertama GLM-Zero, GLM-Zero-Preview. Model ini berfokus pada peningkatan kemampuan penalaran kecerdasan buatan, khususnya pada logika matematika, penulisan kode, dan pemrosesan masalah kompleks yang memerlukan penalaran mendalam. Dibandingkan dengan model dasar, GLM-Zero-Preview telah meningkatkan kemampuan tugas ahlinya secara signifikan sambil mempertahankan kemampuan tugas umum. Performanya dalam evaluasi AIME2024, MATH500, dan LiveCodeBench setara dengan pratinjau OpenAI o1.
Pengguna kini dapat merasakan GLM-Zero-Preview secara gratis di agen "Zero Inference Model" pada platform Zhipu Qingyan. Platform ini mendukung pengunggahan teks dan gambar, dan model akan menampilkan proses penalaran yang lengkap. Pada saat yang sama, pengembang juga dapat memanggil model ini melalui API platform terbuka Zhipu.
Meskipun masih terdapat kesenjangan tertentu antara GLM-Zero-Preview dan model o3 OpenAI, Zhipu Huazhang Technology Co., Ltd. berencana untuk terus mengoptimalkan teknologi pembelajaran penguatan berulang dan akan segera meluncurkan versi resmi GLM-Zero untuk memperluas kemampuannya. pemikiran mendalam dari logika matematika hingga bidang teknologi yang lebih umum.
Dalam hal performa model, GLM-Zero-Preview menunjukkan pentingnya pembelajaran penguatan dalam meningkatkan kemampuan penalaran mendalam model. Seiring dengan meningkatnya jumlah pelatihan, performa model dalam berbagai aspek seperti penalaran mendalam terus meningkat. Hukum penskalaan model dalam tahap inferensi juga telah diverifikasi. Artinya, seiring dengan bertambahnya jumlah token yang dapat dipikirkan oleh model dan diperlukan lebih banyak perhitungan, kualitas hasil yang diberikan oleh model juga terus meningkat. GLM-Zero-Preview dapat mewujudkan pengambilan keputusan secara otonom, penguraian masalah, dan mencoba berbagai cara untuk menyelesaikan masalah selama proses penalaran, yang mirip dengan proses pemikiran dan pengambilan keputusan manusia.
Dalam kasus pengujian sebenarnya, GLM-Zero-Preview menunjukkan kemampuan untuk mengidentifikasi celah logis dan mensimulasikan berbagai asumsi dalam hal penalaran logis. Dari segi matematika, model tersebut memiliki kemampuan induktif dan deduktif yang kuat, dapat dengan cepat menangani operasi matematika yang kompleks, dan telah mencapai tingkat mahasiswa pascasarjana yang berprestasi pada ujian Pascasarjana Matematika I tahun 2025. Dalam hal pemrograman, GLM-Zero-Preview dapat menggunakan berbagai bahasa pemrograman dengan mahir dan membantu pengembang menulis kode dengan cepat.
Spektrum hikmah kata-kata yang jelas:
https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh
Platform terbuka Zhipu:
https://bigmodel.cn/dev/api/normal-model/glm-zero-preview
Peluncuran GLM-Zero-Preview menandai bahwa Zhipu Huazhang telah membuat kemajuan signifikan di bidang penalaran kecerdasan buatan. Strateginya yang bebas dan terbuka juga memfasilitasi pengalaman dan umpan balik pengembang dan pengguna, memberikan data berharga untuk optimalisasi berulang model masa depan. Kami menantikan peluncuran versi resmi GLM-Zero untuk lebih mendorong kemajuan teknologi kecerdasan buatan.