ทีม Hugging Face เปิดตัว AI รุ่นเบาสองรุ่น: SMOLVLM-256M และ SMOLVLM-500M โดยมีพารามิเตอร์ 256 ล้านและ 500 ล้านตามลำดับ ทั้งสองรุ่นนี้เหมาะอย่างยิ่งสำหรับอุปกรณ์ที่มีหน่วยความจำน้อยกว่า 1GB ให้นักพัฒนาซอฟต์แวร์การประมวลผลข้อมูลที่มีราคาถูกและมีประสิทธิภาพสูง ประสิทธิภาพที่มีประสิทธิภาพเกินกว่ารุ่นที่มีขนาดใหญ่กว่าจำนวนมากในมาตรฐานที่หลากหลายโดยเฉพาะอย่างยิ่งในการจัดการกับชาร์ตวิทยาศาสตร์ระดับประถมศึกษาแสดงให้เห็นถึงศักยภาพที่ยิ่งใหญ่ในการศึกษาและการวิจัย
เมื่อเร็ว ๆ นี้ทีมงาน Hugging Face ซึ่งเป็นแพลตฟอร์มการพัฒนาปัญญาประดิษฐ์ได้เปิดตัว AI รุ่นใหม่สองรุ่น SMOLVLM-256M และ SMOLVLM-500M พวกเขายืนยันอย่างมั่นใจว่าทั้งสองรุ่นนั้นเป็นรุ่น AI ที่เล็กที่สุดที่สามารถประมวลผลภาพวิดีโอสั้น ๆ และข้อมูลข้อความพร้อมกันโดยเฉพาะอย่างยิ่งเหมาะสำหรับอุปกรณ์ที่มีหน่วยความจำน้อยกว่า 1GB เช่นแล็ปท็อป นวัตกรรมนี้ช่วยให้นักพัฒนาสามารถบรรลุประสิทธิภาพที่สูงขึ้นด้วยต้นทุนที่ต่ำกว่าเมื่อประมวลผลข้อมูลจำนวนมาก
พารามิเตอร์ของทั้งสองรุ่นนี้คือ 256 ล้านและ 500 ล้านตามลำดับซึ่งหมายความว่าความสามารถในการแก้ปัญหาได้ดีขึ้นเช่นกัน งานที่ซีรี่ส์ SMOLVLM สามารถดำเนินการได้รวมถึงการอธิบายรูปภาพหรือคลิปวิดีโอและตอบคำถามเกี่ยวกับเอกสาร PDF และเนื้อหาของพวกเขาเช่นข้อความสแกนและแผนภูมิ สิ่งนี้ทำให้พวกเขามีโอกาสในการใช้งานที่หลากหลายในหลายสาขาเช่นการศึกษาและการวิจัย
ในระหว่างการฝึกอบรมโมเดลทีม Hugging Face ใช้ประโยชน์จากชุดข้อมูลและข้อความคุณภาพสูง 50 ชุดที่เรียกว่า "The Cauldron" รวมถึงการสแกนไฟล์และชุดข้อมูลการจับคู่โดยละเอียดที่เรียกว่า DocMatix ชุดข้อมูลทั้งสองได้รับการพัฒนาโดยทีม M4 ของ Hugging Face และมุ่งเน้นไปที่การพัฒนาเทคโนโลยี AI หลายรูปแบบ เป็นที่น่าสังเกตว่า SMOLVLM-256M และ SMOLVLM-500M มีประสิทธิภาพสูงกว่ารุ่นที่มีขนาดใหญ่กว่าในการทดสอบมาตรฐานต่างๆเช่น IDEFICS80B และโดยเฉพาะอย่างยิ่งในการทดสอบ AI2D
อย่างไรก็ตามในขณะที่โมเดลขนาดเล็กราคาไม่แพงและหลากหลายอาจไม่ทำงานเช่นเดียวกับโมเดลขนาดใหญ่ในงานการอนุมานที่ซับซ้อน การศึกษาจาก Google Deepmind, Microsoft Research Institute และ MILA Institute ในควิเบกแสดงให้เห็นว่ารุ่นเล็ก ๆ จำนวนมากดำเนินการอย่างน่าผิดหวังในงานที่ซับซ้อนเหล่านี้ นักวิจัยคาดการณ์ว่านี่อาจเป็นเพราะแนวโน้มของแบบจำลองขนาดเล็กเพื่อระบุคุณสมบัติพื้นผิวของข้อมูลและดูเหมือนว่าจะไร้ยางอายเมื่อใช้ความรู้นี้ในสถานการณ์ใหม่
Hugging Face Family ของแบบจำลอง Smolvlm ไม่เพียง แต่เป็นเครื่องมือ AI ขนาดเล็กเท่านั้น แต่ยังแสดงให้เห็นถึงความสามารถที่น่าประทับใจเมื่อต้องรับมือกับงานต่าง ๆ นี่เป็นทางเลือกที่ดีสำหรับนักพัฒนาที่ต้องการการประมวลผลข้อมูลที่มีประสิทธิภาพด้วยต้นทุนต่ำ
การเกิดขึ้นของซีรี่ส์ SMOLVLM ของแบบจำลองได้นำความเป็นไปได้ใหม่ ๆ สำหรับแอพพลิเคชั่น AI ที่มีน้ำหนักเบา แม้ว่าจะยังมีช่องว่างสำหรับการปรับปรุงงานที่ซับซ้อน แต่เกณฑ์ต่ำและประสิทธิภาพสูงทำให้เป็นทางเลือกที่นักพัฒนาซอฟต์แวร์หลายคนสมควรได้รับความสนใจ ในอนาคตเราหวังว่าจะได้เห็นแอปพลิเคชันและการเพิ่มประสิทธิภาพของโมเดล SMOLVLM Series ในสาขาเพิ่มเติม