IBM mengumumkan peluncuran model bahasa besar open source generasi baru Granite3.1, yang bertujuan untuk memimpin bidang AI tingkat perusahaan. Granite3.1 memiliki banyak keunggulan, termasuk panjang konteks yang diperluas hingga 128K, model penyematan yang efisien, kemampuan deteksi halusinasi bawaan, dan peningkatan kinerja keseluruhan secara signifikan. Menurut IBM, model Granite8B Instruct-nya memiliki kinerja terbaik di antara model sumber terbuka dengan skala yang sama, melampaui pesaing seperti Llama3.1 dari Meta, Qwen2.5, dan Gemma2 dari Google. Peluncuran model baru ini mengikuti peluncuran Granite 3.0 pada bulan Oktober, yang mencerminkan iterasi cepat IBM dan investasi berkelanjutan di bidang AI generatif, dengan pendapatan bisnis terkait mencapai US$2 miliar.
IBM secara resmi merilis generasi baru model bahasa besar open source Granite3.1, berusaha untuk menempati posisi terdepan di bidang AI tingkat perusahaan. Seri model ini memiliki panjang konteks yang diperluas 128K, model penyematan, kemampuan deteksi halusinasi bawaan, dan peningkatan kinerja yang signifikan.
IBM mengklaim bahwa model Granite8B Instruct memiliki kinerja terbaik di antara pesaing open source dengan ukuran yang sama, termasuk Llama3.1 dari Meta, Qwen2.5 dan Gemma2 dari Google.
Pelepasan model Granite3.1 terjadi dengan latar belakang iterasi cepat IBM terhadap seri Granite3.0 yang diluncurkan pada awal Oktober. IBM mengungkapkan bahwa pendapatan bisnisnya yang terkait dengan pembangkitan AI telah mencapai $2 miliar. Ide inti dari versi baru ini adalah untuk mengintegrasikan lebih banyak fungsi ke dalam model yang lebih kecil sehingga dapat dijalankan dengan lebih mudah dan hemat biaya bagi pengguna bisnis.
David Cox, wakil presiden IBM Research, mengatakan model Granit banyak digunakan dalam produk internal IBM, layanan konsultasi dan layanan pelanggan, dan juga dirilis dalam bentuk open source, sehingga perlu mencapai tingkat tinggi di semua aspek. Evaluasi kinerja model tidak hanya mengandalkan kecepatan tetapi juga efisiensi, membantu pengguna menghemat waktu saat memperoleh hasil.
Dalam hal durasi konteks, peningkatan Granite3.1 sangat jelas terlihat, mulai dari versi pertama 4K hingga 128K, yang sangat penting bagi pengguna AI perusahaan, terutama dalam hal pengambilan generasi yang ditingkatkan (RAG) dan AI agen cerdas. Panjang konteks yang diperluas memungkinkan model memproses dokumen, log, dan percakapan yang lebih panjang, sehingga memungkinkan model untuk lebih memahami dan merespons kueri kompleks.
IBM juga telah meluncurkan serangkaian model penyematan untuk mempercepat proses konversi data menjadi vektor. Diantaranya, waktu kueri model Granite-Embedding-30M-English adalah 0,16 detik, lebih cepat dibandingkan produk pesaing. Untuk mencapai peningkatan kinerja Granite3.1, IBM telah berinovasi dalam proses pelatihan multi-tahap dan penggunaan data pelatihan berkualitas tinggi.
Dalam hal deteksi halusinasi, model Granite3.1 mengintegrasikan perlindungan halusinasi ke dalam model, yang dapat mendeteksi mandiri dan mengurangi keluaran palsu. Deteksi bawaan ini mengoptimalkan efisiensi keseluruhan dan mengurangi jumlah panggilan inferensi.
Saat ini, model Granite3.1 terbuka untuk pengguna perusahaan secara gratis dan disediakan melalui layanan AI perusahaan Watsonx IBM. Di masa depan, IBM berencana untuk mempertahankan kecepatan pembaruan, dan Granite 3.2 akan meluncurkan fungsionalitas multi-modal pada awal tahun 2025.
Blog resmi: https://www.ibm.com/new/announcements/ibm-granite-3-1-powerful- Performance-long-context-and-more
Menyorot:
IBM meluncurkan model Granite3.1, yang bertujuan untuk mengambil posisi terdepan di pasar model bahasa open source yang besar.
Model baru ini mendukung panjang konteks 128K, sehingga secara signifikan meningkatkan kemampuan dan efisiensi pemrosesan.
Kemampuan deteksi ilusi diintegrasikan ke dalam model, mengoptimalkan kinerja dan akurasi secara keseluruhan.
Secara keseluruhan, peluncuran Granite3.1 menandai kemajuan besar lainnya bagi IBM di bidang model bahasa besar open source. Performanya yang kuat dan fungsinya yang kaya akan menghadirkan pengalaman AI yang lebih nyaman dan efisien bagi pengguna perusahaan. Iterasi di masa depan patut dinantikan.