Institut Inovasi Teknologi Emirates (TII) telah merilis generasi baru model bahasa kecil open source seri Falcon3, yang mencakup empat model dengan ukuran berbeda dan menyediakan dua varian: versi dasar dan versi perintah. Rangkaian model ini memiliki performa yang baik pada peringkat Hugging Face, mengungguli model open source dengan ukuran yang sama dan bahkan mengungguli pesaing seperti Google, Meta, dan Alibaba dalam berbagai pengujian benchmark. Seri Falcon3 efisien dan berbiaya rendah, serta sangat cocok untuk perangkat dan skenario aplikasi dengan sumber daya komputasi terbatas, seperti layanan pelanggan, layanan kesehatan, dan Internet of Things. Data pelatihannya berskala besar dan menggunakan arsitektur dan mekanisme canggih untuk meminimalkan penggunaan memori dan meningkatkan efisiensi inferensi. TII juga menyediakan lingkungan pengujian Falcon Playground untuk memfasilitasi pengembang dan peneliti untuk mencobanya.
Catatan sumber gambar: Gambar dihasilkan oleh AI, dan penyedia layanan otorisasi gambar Midjourney
Performa Falcon 3 menduduki puncak peringkat Hugging Face, mengungguli model open source dengan ukuran yang sama, seperti Meta's Llama dan Qwen-2.5. Secara khusus, versi 7B dan 10B telah menunjukkan keunggulan teknis terdepan dalam kecepatan penalaran, pemahaman bahasa, pelaksanaan instruksi, dan tugas kode dan matematika, dan bahkan melampaui pesaing seperti Google, Meta, dan Alibaba dalam berbagai pengujian benchmark.
Dibandingkan dengan model bahasa besar (LLM) tradisional, model SLM memiliki keunggulan efisiensi tinggi dan biaya rendah karena parameternya lebih sedikit dan desainnya lebih sederhana, dan sangat cocok untuk aplikasi dalam layanan pelanggan, perawatan kesehatan, Internet of Things, dan bidang lainnya. Menurut firma riset pasar Values Reports, pasar SLM diperkirakan akan tumbuh rata-rata tahunan sebesar 18% selama lima tahun ke depan.
Skala data pelatihan seri Falcon3 mencapai 14 triliun token, lebih dari dua kali lipat pendahulunya Falcon2. Seri ini mengadopsi arsitektur khusus dekoder dan mekanisme perhatian kueri yang dikelompokkan untuk meminimalkan penggunaan memori sekaligus meningkatkan efisiensi inferensi. Falcon3 mendukung empat bahasa, termasuk Inggris, Prancis, Spanyol, dan Portugis, serta dilengkapi dengan jendela konteks 32K, yang dapat menangani input teks panjang dan memenuhi kebutuhan berbagai industri.
TII mengatakan model dasar Falcon3 cocok untuk tugas-tugas umum, sedangkan versi perintah dioptimalkan untuk tugas-tugas percakapan seperti layanan pelanggan dan asisten virtual. Peluncuran seri ini akan semakin mendorong pengembangan komputasi edge dan aplikasi sensitif privasi, mendukung skenario seperti rekomendasi yang dipersonalisasi, analisis data, diagnosis medis, dan optimalisasi rantai pasokan.
Semua model Falcon3 dirilis di bawah TII Falcon License 2.0, sebuah lisensi permisif berdasarkan Apache 2.0 yang mendukung pengembangan dan penerapan AI yang bertanggung jawab. Untuk membantu pengembang dan peneliti memulai, TII juga meluncurkan lingkungan pengujian Falcon Playground, di mana pengguna dapat mencoba model ini sebelum mengintegrasikannya.
Peluncuran seri Falcon3 yang bersifat open source menurunkan ambang batas penerapan teknologi AI, menyediakan alat canggih bagi pengembang dan peneliti, mempercepat penerapan dan inovasi teknologi AI di berbagai bidang, serta menandai tren mempopulerkan dan demokratisasi lebih lanjut teknologi AI.