สถาบันนวัตกรรมเทคโนโลยีแห่งเอมิเรตส์ (TII) ได้เปิดตัวโมเดลภาษาขนาดเล็กแบบโอเพ่นซอร์สรุ่นใหม่ ซีรีส์ Falcon3 รวมถึงโมเดลสี่ขนาดที่มีขนาดแตกต่างกัน (1B, 3B, 7B และ 10B) และมีสองรูปแบบ: เวอร์ชันพื้นฐานและเวอร์ชันคำสั่ง การเปิดตัวครั้งนี้มีจุดมุ่งหมายเพื่อลดเกณฑ์การใช้เทคโนโลยี AI และมอบโซลูชัน AI ที่มีประสิทธิภาพและประหยัดแก่นักพัฒนา นักวิจัย และองค์กรต่างๆ Falcon3 ทำงานได้ดีในการจัดอันดับ Hugging Face ซึ่งเหนือกว่ารุ่นโอเพ่นซอร์สที่มีขนาดเท่ากัน และผลิตภัณฑ์ที่มีประสิทธิภาพเหนือกว่าจากยักษ์ใหญ่ เช่น Google, Meta และ Alibaba ในการทดสอบเกณฑ์มาตรฐานหลายรายการ ซึ่งสะท้อนถึงความเร็วในการอนุมาน ความเข้าใจภาษา และข้อได้เปรียบทางเทคนิคในด้านอื่นๆ ด้าน
หมายเหตุแหล่งที่มาของรูปภาพ: รูปภาพนี้สร้างขึ้นโดย AI และผู้ให้บริการอนุญาตรูปภาพ Midjourney
ประสิทธิภาพของ Falcon 3 แซงหน้า Hugging Face แซงหน้ารุ่นโอเพ่นซอร์สที่มีขนาดเท่ากัน เช่น Meta's Llama และ Qwen-2.5 โดยเฉพาะอย่างยิ่ง เวอร์ชัน 7B และ 10B ได้แสดงให้เห็นถึงข้อได้เปรียบทางเทคนิคชั้นนำในด้านความเร็วในการให้เหตุผล ความเข้าใจภาษา การดำเนินการตามคำสั่ง และงานโค้ดและคณิตศาสตร์ และยังเหนือกว่าคู่แข่งอย่าง Google, Meta และ Alibaba ในการทดสอบเกณฑ์มาตรฐานหลายรายการ
เมื่อเปรียบเทียบกับโมเดลภาษาขนาดใหญ่ (LLM) แบบดั้งเดิม โมเดล SLM มีข้อได้เปรียบในด้านประสิทธิภาพสูงและต้นทุนต่ำ เนื่องจากมีพารามิเตอร์น้อยกว่าและการออกแบบที่เรียบง่ายกว่า และเหมาะอย่างยิ่งสำหรับการใช้งานในการบริการลูกค้า การดูแลสุขภาพ Internet of Things และสาขาอื่นๆ ตลาด SLM คาดว่าจะเติบโตในอัตราเฉลี่ยต่อปีที่ 18% ในอีกห้าปีข้างหน้า ตามรายงานของบริษัทวิจัยตลาด Values Reports
ระดับข้อมูลการฝึกอบรมของซีรีส์ Falcon3 สูงถึง 14 ล้านล้านโทเค็น ซึ่งมากกว่าสองเท่าของ Falcon2 รุ่นก่อน ซีรีส์นี้ใช้สถาปัตยกรรมแบบถอดรหัสเท่านั้นและกลไกความสนใจคิวรีแบบจัดกลุ่มเพื่อลดการใช้หน่วยความจำในขณะที่ปรับปรุงประสิทธิภาพการอนุมาน Falcon3 รองรับสี่ภาษา ได้แก่ อังกฤษ ฝรั่งเศส สเปน และโปรตุเกส และมีหน้าต่างบริบทขนาด 32K ซึ่งสามารถรองรับข้อความที่ป้อนขนาดยาวและตอบสนองความต้องการของอุตสาหกรรมต่างๆ
TII กล่าวว่าโมเดลพื้นฐานของ Falcon3 เหมาะสำหรับงานวัตถุประสงค์ทั่วไป ในขณะที่เวอร์ชันคำสั่งได้รับการปรับให้เหมาะสมสำหรับงานสนทนา เช่น การบริการลูกค้า และผู้ช่วยเสมือน การเปิดตัวซีรีส์นี้จะส่งเสริมการพัฒนา Edge Computing และแอปพลิเคชันที่ไวต่อความเป็นส่วนตัว โดยสนับสนุนสถานการณ์ต่างๆ เช่น คำแนะนำส่วนบุคคล การวิเคราะห์ข้อมูล การวินิจฉัยทางการแพทย์ และการเพิ่มประสิทธิภาพห่วงโซ่อุปทาน
Falcon3 ทุกรุ่นเปิดตัวภายใต้ TII Falcon License 2.0 ซึ่งเป็นใบอนุญาตที่อนุญาตบน Apache 2.0 ซึ่งสนับสนุนการพัฒนาและการใช้งาน AI อย่างมีความรับผิดชอบ เพื่อช่วยนักพัฒนาและนักวิจัยในการเริ่มต้น TII ยังได้เปิดตัวสภาพแวดล้อมการทดสอบ Falcon Playground ซึ่งผู้ใช้สามารถทดลองใช้โมเดลเหล่านี้ก่อนที่จะบูรณาการเข้าด้วยกัน
คุณสมบัติโอเพ่นซอร์สและประสิทธิภาพที่มีประสิทธิภาพของซีรีส์ Falcon3 ทำให้ผลิตภัณฑ์นี้เป็นตัวเลือกที่เหมาะสมที่สุดสำหรับแอปพลิเคชัน AI ขนาดเล็ก โดยคาดว่าจะเร่งให้เกิดความนิยมและการประยุกต์ใช้เทคโนโลยี AI ในสาขาต่างๆ และส่งเสริมการทำให้เทคโนโลยี AI เป็นประชาธิปไตยมากขึ้น ประสิทธิภาพที่ยอดเยี่ยมเหนือกว่าคู่แข่งในการทดสอบเกณฑ์มาตรฐานหลายรายการยังบ่งชี้ว่าโมเดลภาษาขนาดเล็กมีศักยภาพที่ยอดเยี่ยมสำหรับการพัฒนาในอนาคต