Permintaan akan model AI kecil melonjak, TII UEA merilis Falcon3 untuk mengantarkan era AI ringan - artikel AI

Penulis：Eve Cole Waktu Pembaruan：2025-01-24 16:16:01

Institut Inovasi Teknologi Emirates (TII) telah merilis generasi baru model bahasa kecil open source seri Falcon3, termasuk empat model dengan ukuran berbeda (1B, 3B, 7B, dan 10B), dan menyediakan dua varian: versi dasar dan versi instruksi. Rilis ini bertujuan untuk menurunkan ambang batas penggunaan teknologi AI dan memberikan solusi AI yang efisien dan ekonomis kepada pengembang, peneliti, dan perusahaan. Falcon3 berkinerja baik pada peringkat Hugging Face, mengungguli model open source dengan ukuran yang sama, dan mengungguli produk dari raksasa seperti Google, Meta, dan Alibaba dalam berbagai pengujian benchmark, yang mencerminkan kecepatan inferensi, pemahaman bahasa, dan eksekusi instruksi aspek.

Catatan sumber gambar: Gambar dihasilkan oleh AI, dan penyedia layanan otorisasi gambar Midjourney

Performa Falcon 3 menduduki puncak peringkat Hugging Face, mengungguli model open source dengan ukuran yang sama, seperti Meta's Llama dan Qwen-2.5. Secara khusus, versi 7B dan 10B telah menunjukkan keunggulan teknis terdepan dalam kecepatan penalaran, pemahaman bahasa, pelaksanaan instruksi, dan tugas kode dan matematika, dan bahkan melampaui pesaing seperti Google, Meta, dan Alibaba dalam berbagai pengujian benchmark.

Dibandingkan dengan model bahasa besar (LLM) tradisional, model SLM memiliki keunggulan efisiensi tinggi dan biaya rendah karena parameternya lebih sedikit dan desainnya lebih sederhana, dan sangat cocok untuk aplikasi dalam layanan pelanggan, perawatan kesehatan, Internet of Things, dan bidang lainnya. Pasar SLM diperkirakan akan tumbuh pada tingkat tahunan rata-rata 18% selama lima tahun ke depan, menurut firma riset pasar Values Reports.

Skala data pelatihan seri Falcon3 mencapai 14 triliun token, lebih dari dua kali lipat pendahulunya Falcon2. Seri ini mengadopsi arsitektur khusus dekoder dan mekanisme perhatian kueri yang dikelompokkan untuk meminimalkan penggunaan memori sekaligus meningkatkan efisiensi inferensi. Falcon3 mendukung empat bahasa, termasuk Inggris, Prancis, Spanyol, dan Portugis, serta dilengkapi dengan jendela konteks 32K, yang dapat menangani input teks panjang dan memenuhi kebutuhan berbagai industri.

TII mengatakan model dasar Falcon3 cocok untuk tugas-tugas umum, sedangkan versi perintah dioptimalkan untuk tugas-tugas percakapan seperti layanan pelanggan dan asisten virtual. Peluncuran seri ini akan semakin mendorong pengembangan komputasi edge dan aplikasi sensitif privasi, mendukung skenario seperti rekomendasi yang dipersonalisasi, analisis data, diagnosis medis, dan optimalisasi rantai pasokan.

Semua model Falcon3 dirilis di bawah TII Falcon License 2.0, sebuah lisensi permisif berdasarkan Apache 2.0 yang mendukung pengembangan dan penerapan AI yang bertanggung jawab. Untuk membantu pengembang dan peneliti memulai, TII juga meluncurkan lingkungan pengujian Falcon Playground, di mana pengguna dapat mencoba model ini sebelum mengintegrasikannya.

Fitur open source dan kinerja efisien dari seri Falcon3 menjadikannya pilihan ideal untuk aplikasi AI ringan. Hal ini diharapkan dapat mempercepat pemasyarakatan dan penerapan teknologi AI di berbagai bidang dan mendorong demokratisasi lebih lanjut dari teknologi AI. Performanya yang luar biasa, mengungguli pesaing dalam berbagai pengujian benchmark, juga menunjukkan bahwa model bahasa kecil memiliki potensi besar untuk pengembangan di masa depan.