สถาบันนวัตกรรมเทคโนโลยีแห่งเอมิเรตส์ (TII) ได้เปิดตัวซีรีส์ Falcon3 รุ่นภาษาขนาดเล็กโอเพ่นซอร์สรุ่นใหม่ ซึ่งประกอบด้วยรุ่นที่มีขนาดแตกต่างกันสี่รุ่น และมีสองรุ่น: เวอร์ชันพื้นฐานและเวอร์ชันคำสั่ง โมเดลซีรีส์นี้ทำงานได้ดีในการจัดอันดับ Hugging Face โดยมีประสิทธิภาพเหนือกว่าโมเดลโอเพ่นซอร์สที่มีขนาดเท่ากัน และยังเหนือกว่าคู่แข่งอย่าง Google, Meta และ Alibaba ในการทดสอบเกณฑ์มาตรฐานหลายรายการ ซีรีส์ Falcon3 มีประสิทธิภาพและต้นทุนต่ำ และเหมาะอย่างยิ่งสำหรับอุปกรณ์และสถานการณ์การใช้งานที่มีทรัพยากรการประมวลผลจำกัด เช่น การบริการลูกค้า การดูแลสุขภาพ และอินเทอร์เน็ตในทุกสิ่ง ข้อมูลการฝึกอบรมมีขนาดใหญ่และใช้สถาปัตยกรรมและกลไกขั้นสูงเพื่อลดการใช้หน่วยความจำและปรับปรุงประสิทธิภาพการอนุมาน TII ยังมีสภาพแวดล้อมการทดสอบ Falcon Playground เพื่ออำนวยความสะดวกให้กับนักพัฒนาและนักวิจัยในการทดลองใช้
หมายเหตุแหล่งที่มาของรูปภาพ: รูปภาพนี้สร้างขึ้นโดย AI และผู้ให้บริการอนุญาตรูปภาพ Midjourney
ประสิทธิภาพของ Falcon 3 แซงหน้า Hugging Face แซงหน้ารุ่นโอเพ่นซอร์สที่มีขนาดเท่ากัน เช่น Meta's Llama และ Qwen-2.5 โดยเฉพาะอย่างยิ่ง เวอร์ชัน 7B และ 10B ได้แสดงให้เห็นถึงข้อได้เปรียบทางเทคนิคชั้นนำในด้านความเร็วในการให้เหตุผล ความเข้าใจภาษา การดำเนินการตามคำสั่ง และงานโค้ดและคณิตศาสตร์ และยังเหนือกว่าคู่แข่งอย่าง Google, Meta และ Alibaba ในการทดสอบเกณฑ์มาตรฐานหลายรายการ
เมื่อเปรียบเทียบกับโมเดลภาษาขนาดใหญ่ (LLM) แบบดั้งเดิม โมเดล SLM มีข้อได้เปรียบในด้านประสิทธิภาพสูงและต้นทุนต่ำ เนื่องจากมีพารามิเตอร์น้อยกว่าและการออกแบบที่เรียบง่ายกว่า และเหมาะอย่างยิ่งสำหรับการใช้งานในการบริการลูกค้า การดูแลสุขภาพ Internet of Things และสาขาอื่นๆ ตามรายงานค่านิยมของบริษัทวิจัยตลาด ตลาด SLM คาดว่าจะเติบโตในอัตราเฉลี่ยต่อปีที่ 18% ในอีกห้าปีข้างหน้า
ระดับข้อมูลการฝึกอบรมของซีรีส์ Falcon3 สูงถึง 14 ล้านล้านโทเค็น ซึ่งมากกว่าสองเท่าของ Falcon2 รุ่นก่อน ซีรีส์นี้ใช้สถาปัตยกรรมแบบถอดรหัสเท่านั้นและกลไกความสนใจคิวรีแบบจัดกลุ่มเพื่อลดการใช้หน่วยความจำในขณะที่ปรับปรุงประสิทธิภาพการอนุมาน Falcon3 รองรับสี่ภาษา ได้แก่ อังกฤษ ฝรั่งเศส สเปน และโปรตุเกส และมีหน้าต่างบริบทขนาด 32K ซึ่งสามารถรองรับข้อความที่ป้อนขนาดยาวและตอบสนองความต้องการของอุตสาหกรรมต่างๆ
TII กล่าวว่าโมเดลพื้นฐานของ Falcon3 เหมาะสำหรับงานวัตถุประสงค์ทั่วไป ในขณะที่เวอร์ชันคำสั่งได้รับการปรับให้เหมาะสมสำหรับงานสนทนา เช่น การบริการลูกค้า และผู้ช่วยเสมือน การเปิดตัวซีรีส์นี้จะส่งเสริมการพัฒนา Edge Computing และแอปพลิเคชันที่ไวต่อความเป็นส่วนตัว โดยสนับสนุนสถานการณ์ต่างๆ เช่น คำแนะนำส่วนบุคคล การวิเคราะห์ข้อมูล การวินิจฉัยทางการแพทย์ และการเพิ่มประสิทธิภาพห่วงโซ่อุปทาน
Falcon3 ทุกรุ่นเปิดตัวภายใต้ TII Falcon License 2.0 ซึ่งเป็นใบอนุญาตที่อนุญาตบน Apache 2.0 ซึ่งสนับสนุนการพัฒนาและการใช้งาน AI อย่างมีความรับผิดชอบ เพื่อช่วยนักพัฒนาและนักวิจัยในการเริ่มต้น TII ยังได้เปิดตัวสภาพแวดล้อมการทดสอบ Falcon Playground ซึ่งผู้ใช้สามารถลองใช้โมเดลเหล่านี้ก่อนที่จะรวมเข้าด้วยกัน
การเปิดตัวซีรีส์ Falcon3 แบบโอเพ่นซอร์สช่วยลดเกณฑ์การประยุกต์ใช้เทคโนโลยี AI ลงได้ ช่วยให้นักพัฒนาและนักวิจัยมีเครื่องมืออันทรงพลัง เร่งการประยุกต์ใช้และนวัตกรรมของเทคโนโลยี AI ในสาขาต่างๆ และประกาศแนวโน้มของการแพร่หลายและการทำให้เทคโนโลยี AI เป็นประชาธิปไตยมากขึ้น