Alibaba Cloud memangkas harga lagi: Model besar Qwen-VL telah diturunkan harganya sebesar 1 yuan dan dapat memproses 600 gambar

Penulis：Eve Cole Waktu Pembaruan：2025-01-19 08:32:01

Alibaba Cloud sekali lagi mengumumkan penyesuaian harga untuk model pemahaman visual seri Tongyi Qianwen yang besar. Ini adalah penurunan harga ketiga tahun ini, dengan penurunan harga lebih dari 80%. Langkah ini akan mengurangi biaya pengguna secara signifikan dan semakin mendorong pemasyarakatan dan penerapan teknologi AI. Penurunan harga ini mencakup beberapa model seperti Qwen-VL-Plus dan Qwen-VL-Max. Di antaranya, harga model Qwen-VL-Plus telah mencapai titik terendah baru di seluruh jaringan, menghadirkan lebih banyak peluang aplikasi bagi pengembang dan perusahaan.

Setelah dua kali pemotongan harga pada bulan Mei dan September tahun ini, Alibaba Cloud sekali lagi mengumumkan pemotongan harga untuk model-model besarnya, dan meluncurkan penyesuaian harga putaran ketiga pada tahun ini. Penurunan harga kali ini sangat signifikan. Harga model pemahaman visual seri Tongyi Qianwen telah diturunkan lebih dari 80%.

Diantaranya, harga model Qwen-VL-Plus turun 81%, dengan harga input hanya 0,0015 yuan/ribu token, menetapkan harga terendah baru di seluruh jaringan; sedangkan Qwen-VL-Max berkinerja lebih tinggi turun harganya menjadi 0,003 yuan/ribu token, penurunan sebesar 85%. Menurut harga baru, 1 yuan dapat memproses hingga sekitar 600 gambar 720P, atau 1.700 gambar 480P.

阿里云

Model besar seri Qwen-VL adalah model besar multi-modal yang diluncurkan oleh Alibaba Cloud. Model tersebut telah menjadi salah satu model paling populer di komunitas sumber terbuka dan memiliki kemampuan penalaran visual yang kuat. Model ini tidak hanya dapat mengenali gambar dengan resolusi dan rasio aspek berbeda, tetapi juga memahami video berdurasi lebih dari 20 menit, dan memiliki kemampuan pemahaman visual untuk mengoperasikan objek cerdas secara mandiri seperti ponsel dan robot. Qwen-VL banyak digunakan dalam skenario pengenalan visual berbagai terminal, meliputi ponsel, mobil, dan bidang lainnya.

Tim Alibaba Cloud Bailian menyatakan bahwa penurunan harga ini terutama disebabkan oleh optimalisasi berkelanjutan infrastruktur dan struktur model Alibaba Cloud, serta efek skala yang disebabkan oleh pertumbuhan eksponensial panggilan model besar. Dengan kemajuan dan optimalisasi teknologi yang berkelanjutan, efisiensi penalaran Alibaba Cloud telah meningkat pesat. Sistem penjadwalan daya komputasi AI elastis yang dibangun oleh Alibaba Cloud, dikombinasikan dengan mesin akselerasi inferensi terdistribusi Bailian, tidak hanya mengurangi biaya inferensi model secara signifikan, namun juga mempercepat kecepatan inferensi. Alibaba Cloud juga menyebutkan bahwa seiring dengan optimalisasi efek pemahaman visual Qwen-VL, model ini telah menjadi salah satu model dengan pertumbuhan tercepat di platform Bailian.

Untuk lebih mengurangi biaya bagi pengguna dalam menggunakan API model besar, Alibaba Cloud Bailian juga meluncurkan model penagihan KV Cache baru. Mode ini secara otomatis menyimpan konteks dalam cache untuk menghindari penghitungan berulang, sehingga secara signifikan mengurangi biaya pemanggilan model. Mode ini sangat cocok untuk skenario seperti teks panjang, penyelesaian kode, percakapan multi-putaran, dan ringkasan teks tertentu.

Seiring Alibaba Cloud terus mengoptimalkan infrastruktur dan model, penurunan harga model pemahaman visual seri Qwen-VL tidak hanya membuat teknologi AI lebih mudah diakses oleh masyarakat, namun juga menghadirkan lebih banyak peluang aplikasi bagi pengembang dan perusahaan. Dengan terus mengoptimalkan kinerja dan mengurangi biaya penggunaan, Alibaba Cloud mempromosikan pemasyarakatan dan penerapan teknologi AI serta memberikan dukungan teknis yang lebih kuat untuk transformasi digital di berbagai industri.

Penurunan harga ini mencerminkan tekad Alibaba Cloud untuk menurunkan ambang batas teknologi AI dan mempromosikan AI yang inklusif. Hal ini memberikan vitalitas baru ke dalam pengembangan industri dan menandai masa depan yang lebih luas untuk aplikasi AI.