Llama 3.1 ซึ่งเป็นโมเดลภาษาโอเพ่นซอร์สขนาดยักษ์ที่มีพารามิเตอร์ 405 พันล้านพารามิเตอร์ สร้างความตกตะลึงครั้งใหญ่ในด้าน AI เนื่องจากการรั่วไหลโดยไม่ได้เผยแพร่อย่างเป็นทางการ ประสิทธิภาพของมันทรงพลังมากจนเหนือกว่า GPT-4o ในการทดสอบเกณฑ์มาตรฐานบางรายการ ซึ่งถือเป็นการกำหนดเกณฑ์มาตรฐานใหม่สำหรับรุ่นโอเพ่นซอร์ส การอภิปรายอย่างเผ็ดร้อนเกี่ยวกับ Reddit ยังพิสูจน์ให้เห็นถึงผลกระทบต่อชุมชน AI บทความนี้จะเจาะลึกประสิทธิภาพ ไฮไลท์ และมาตรการด้านความปลอดภัยของ Llama 3.1 และเปิดเผยโมเดลลึกลับนี้
Llama3.1 ถูกรั่วไหลออกมา! คุณได้ยินถูกแล้ว โมเดลโอเพ่นซอร์สที่มีพารามิเตอร์ 405 พันล้านตัวนี้ทำให้เกิดความโกลาหลใน Reddit นี่อาจเป็นโมเดลโอเพ่นซอร์สที่ใกล้เคียงที่สุดกับ GPT-4o จนถึงปัจจุบัน และยังเหนือกว่าในบางแง่มุมด้วยซ้ำ
Llama3.1 เป็นโมเดลภาษาขนาดใหญ่ที่พัฒนาโดย Meta (เดิมชื่อ Facebook) แม้ว่าจะยังไม่มีการเปิดตัวอย่างเป็นทางการ แต่เวอร์ชันที่รั่วไหลออกมาได้สร้างความปั่นป่วนในชุมชนแล้ว รุ่นนี้ไม่เพียงแต่รวมถึงรุ่นพื้นฐานเท่านั้น แต่ยังรวมผลลัพธ์การวัดประสิทธิภาพ 8B, 70B และพารามิเตอร์สูงสุด 405B อีกด้วย
การเปรียบเทียบประสิทธิภาพ: Llama3.1 กับ GPT-4o
เมื่อพิจารณาจากผลการเปรียบเทียบที่รั่วไหลออกมา แม้แต่ Llama3.1 เวอร์ชัน 70B ก็เหนือกว่า GPT-4o ในการทดสอบเกณฑ์มาตรฐานหลายรายการ นี่เป็นครั้งแรกที่โมเดลโอเพ่นซอร์สถึงระดับ SOTA (เทคโนโลยีที่ทันสมัยที่สุด) ในเกณฑ์มาตรฐานต่างๆ ผู้คนอดไม่ได้ที่จะถอนหายใจ: พลังของโอเพ่นซอร์สนั้นทรงพลังจริงๆ!
จุดเด่นของโมเดล: รองรับหลายภาษา ข้อมูลการฝึกอบรมที่สมบูรณ์ยิ่งขึ้น
โมเดล Llama3.1 ใช้โทเค็น 15T+ จากแหล่งข้อมูลสาธารณะสำหรับการฝึกอบรม และกำหนดเวลาข้อมูลก่อนการฝึกอบรมคือเดือนธันวาคม 2023 รองรับไม่เพียงแต่ภาษาอังกฤษเท่านั้น แต่ยังรองรับภาษาฝรั่งเศส เยอรมัน ฮินดี อิตาลี โปรตุเกส สเปน และไทยด้วย ทำให้เหมาะสำหรับกรณีการใช้งานการสนทนาหลายภาษา
ทีมวิจัย Llama3.1 ให้ความสำคัญอย่างยิ่งต่อความปลอดภัยของแบบจำลอง พวกเขาใช้วิธีการรวบรวมข้อมูลที่หลากหลายซึ่งรวมข้อมูลที่มนุษย์สร้างขึ้นและข้อมูลสังเคราะห์เพื่อลดความเสี่ยงด้านความปลอดภัยที่อาจเกิดขึ้น นอกจากนี้ โมเดลยังแนะนำการแจ้งเตือนเกี่ยวกับขอบเขตและการแจ้งเตือนที่ขัดแย้งกันเพื่อปรับปรุงการควบคุมคุณภาพข้อมูล
ที่มาการ์ดโมเดล: https://pastebin.com/9jGkYbXY#google_vignette
การรั่วไหลของ Llama 3.1 จะมีผลกระทบอย่างลึกซึ้งต่อสนาม AI อย่างไม่ต้องสงสัย ไม่เพียงแต่แสดงให้เห็นถึงศักยภาพอันยิ่งใหญ่ของโมเดลโอเพ่นซอร์สเท่านั้น แต่ยังกระตุ้นให้เกิดการพิจารณาเพิ่มเติมเกี่ยวกับความปลอดภัยของโมเดลและประเด็นด้านจริยธรรมอีกด้วย ในอนาคต เราจะให้ความสนใจกับ Llama 3.1 และการพัฒนาที่ตามมาต่อไป และหวังว่าจะนำความประหลาดใจมาสู่ความก้าวหน้าของเทคโนโลยี AI ต่อไป