เมื่อเร็วๆ นี้ Mistral ซึ่งเป็นโมเดลขนาดใหญ่ในประเทศที่ออกโดยมหาวิทยาลัย Tsinghua ได้กระตุ้นการตอบรับอย่างกระตือรือร้นใน GitHub ขนาด 2B มีประสิทธิภาพเหนือกว่าโมเดล "ขนาดใหญ่" หลายตัว ซึ่งน่าทึ่งมาก สิ่งนี้ไม่เพียงสะท้อนให้เห็นในประสิทธิภาพอันทรงพลังเท่านั้น แต่ยังรวมถึงความได้เปรียบด้านต้นทุนที่ต่ำมากด้วย ต้นทุนการอนุมาน 1,700,000 โทเค็นสามารถรับได้เพียง 1 หยวน ซึ่งต่ำกว่าผลิตภัณฑ์ที่คล้ายคลึงกันมาก นอกจากนี้ Mistral ยังมีความสามารถหลายรูปแบบ ซึ่งแสดงให้เห็นถึงศักยภาพในการใช้งานที่แข็งแกร่ง เหตุการณ์นี้พิสูจน์ให้เห็นอีกครั้งว่าในด้าน AI การออกแบบโมเดลที่ยอดเยี่ยมและการควบคุมต้นทุนมีความสำคัญเท่าเทียมกัน และไม่ใช่แค่ "ปริมาณเท่านั้นที่เป็นสิ่งสำคัญ"
บทความนี้มุ่งเน้นไปที่:
เมื่อเร็วๆ นี้ แผนกมหาวิทยาลัย Tsinghua ได้เปิดตัว Mistral ที่ผลิตในประเทศ ซึ่งมีขนาดเพียง 2B เท่านั้น ได้รับการต้อนรับอย่างอบอุ่นบน GitHub และได้รับดาวมากกว่า 300 ดวงในหนึ่งวัน ในด้านประสิทธิภาพ ผลิตภัณฑ์นี้ค่อนข้างมีการแข่งขันสูง มีความแตกต่างอย่างมากระหว่างประสิทธิภาพและขนาด เหนือกว่ารุ่นใหญ่ที่มี "ปริมาณมาก" ทั่วไปหลายรุ่น ด้านต้นทุนนั้นน่าทึ่งยิ่งกว่านั้น มีค่าใช้จ่ายเพียง 1 หยวนเพื่อรับโทเค็น 1,700,000 ในราคาอนุมาน เมื่อเปรียบเทียบกับผลิตภัณฑ์ที่คล้ายคลึงกัน นอกเหนือจากคุณสมบัติข้างต้นแล้ว ผลิตภัณฑ์ยังมีความสามารถหลายรูปแบบและแสดงผลลัพธ์ที่ยอดเยี่ยมอีกด้วย
ความสำเร็จของ Mistral แสดงให้เห็นถึงความก้าวหน้าในด้านประสิทธิภาพและราคาของรุ่นขนาดใหญ่ในประเทศ และยังให้แนวคิดใหม่สำหรับทิศทางการพัฒนาของรุ่นขนาดใหญ่ในอนาคต ผมเชื่อว่าในอนาคต เราจะได้เห็นความประหลาดใจที่คล้ายกันมากขึ้น ซึ่งจะช่วยส่งเสริมความก้าวหน้าอย่างต่อเนื่องของเทคโนโลยี AI