AI21 merilis model Mamba tingkat produksi pertama di dunia, Jamba, yang mendukung panjang konteks 256 ribu

Penulis：Eve Cole Waktu Pembaruan：2025-02-20 12:00:03

Baru-baru ini, beberapa perusahaan kecerdasan buatan terkemuka telah membuat kemajuan signifikan di bidang model bahasa skala besar dan telah meluncurkan model dan fitur baru yang bertujuan untuk meningkatkan kinerja model dan pengalaman pengguna. Pembaruan ini mencakup peningkatan panjang konteks, peningkatan arsitektur model, dan dukungan untuk aplikasi tingkat perusahaan, yang menandai evolusi berkelanjutan dan kematangan teknologi AI. Artikel ini akan fokus pada hasil terbaru yang baru-baru ini dirilis oleh AI21 Labs, Mistral AI, dan Cohere.

AI21 merilis model Jamba tingkat produksi Mamba pertama di dunia, yang mengadopsi arsitektur SSM-Transformer, memiliki parameter 52B dan mendukung panjang konteks 256K. Model Jamba menggabungkan teknologi SSM dan arsitektur Transformer dan bekerja dengan baik dalam memproses tugas teks panjang. MistralAI meluncurkan Mistral7Bv0.2BaseModel, meningkatkan konteksnya hingga 32K, dan berupaya memberikan solusi AI yang lebih baik. Cohere merilis Command-R, dengan fokus pada penerapan kecerdasan buatan skala produksi dan menyediakan model generatif yang dapat diskalakan bagi perusahaan.

Peluncuran model-model baru ini menunjukkan vitalitas inovasi berkelanjutan di bidang kecerdasan buatan, dan juga menunjukkan bahwa model bahasa berskala besar akan berkembang ke arah yang lebih efisien dan kuat di masa depan. Jendela konteks yang lebih panjang dan arsitektur model yang lebih kuat akan memberikan pengalaman aplikasi yang lebih kaya kepada pengguna dan memberikan landasan yang lebih kokoh untuk aplikasi AI tingkat perusahaan. Kami berharap dapat melihat lebih banyak inovasi di masa depan.