Meta กำลังส่งเสริมการพัฒนารูปแบบภาษาขนาดใหญ่ Llama โดยมีเป้าหมายในการสร้างหน่วยสืบราชการลับของเครื่องจักรอิสระที่สามารถเข้ากับชีวิตประจำวันได้อย่างแท้จริงและมีความสามารถในการใช้เหตุผลที่แข็งแกร่ง บทความนี้จะสำรวจกลยุทธ์การปรับปรุงของเมตาวิธีการฝึกอบรมและแผนการในอนาคตสำหรับโมเดล Llama รวมถึงความคืบหน้าของ LLAMA4 ที่คาดการณ์ไว้สูง Meta มุ่งมั่นที่จะสร้างโมเดล Llama ลงในระบบ AI ที่สามารถจัดการงานที่ซับซ้อนได้อย่างมีประสิทธิภาพและปรับให้เข้ากับสภาพแวดล้อมที่เปลี่ยนแปลงแบบไดนามิกซึ่งจะส่งผลกระทบอย่างลึกซึ้งต่อสาขาปัญญาประดิษฐ์
เมื่อเร็ว ๆ นี้ Yann Lecun หัวหน้านักวิทยาศาสตร์ AI ของ Meta กล่าวว่า Intelligence Machine Intelligence (AMI) สามารถช่วยเหลือชีวิตประจำวันของผู้คนได้อย่างแท้จริง Meta กำลังทำงานเพื่อปรับปรุงความสามารถในการใช้เหตุผลของรุ่น Llama โดยหวังว่าจะแข่งขันกับรุ่นชั้นนำเช่น GPT-4O
รองประธาน Manohar Paluri ของ Meta กล่าวว่าพวกเขากำลังสำรวจเพื่อสร้างแบบจำลอง Llama ไม่เพียง แต่“ แผน” แต่ยังประเมินการตัดสินใจแบบเรียลไทม์และปรับเปลี่ยนเมื่อเงื่อนไขเปลี่ยนไป วิธีการวนซ้ำนี้ผสมผสานเทคโนโลยีของ "ห่วงโซ่คิด" เพื่อให้ได้สติปัญญาของเครื่องจักรอิสระที่สามารถรวมการรับรู้การใช้เหตุผลและการวางแผนได้อย่างมีประสิทธิภาพ
นอกจากนี้ Paluri ยังเน้นว่าในการอนุมาน AI ใน“ โดเมนที่ไม่สามารถตรวจสอบได้” แบบจำลองจำเป็นต้องแบ่งงานที่ซับซ้อนออกเป็นขั้นตอนที่จัดการได้เพื่อปรับตัวแบบไดนามิก ตัวอย่างเช่นการวางแผนการเดินทางไม่เพียง แต่ต้องจองเที่ยวบินเท่านั้น แต่ยังต้องจัดการกับการเปลี่ยนแปลงสภาพอากาศแบบเรียลไทม์ซึ่งอาจนำไปสู่การวางแผนเส้นทางอีกครั้ง Meta ยังเพิ่งเปิดตัวโมเดล Dualformer ซึ่งสามารถสลับระหว่างสัญชาตญาณที่รวดเร็วและการคิดช้าในระหว่างการรับรู้ของมนุษย์
เกี่ยวกับการฝึกอบรมโมเดล LLAMA Meta ใช้การเรียนรู้ที่ดูแลตนเอง (SSL) ซึ่งช่วยให้แบบจำลองเรียนรู้การแสดงข้อมูลที่หลากหลายในหลายสาขาทำให้มีความยืดหยุ่น ในขณะเดียวกันการเรียนรู้การเสริมแรงและข้อเสนอแนะของมนุษย์ (RLHF) ทำให้แบบจำลองทำงานได้ดีขึ้นในงานที่เฉพาะเจาะจง การรวมกันของทั้งสองทำให้โมเดล Llama โดดเด่นในการสร้างข้อมูลสังเคราะห์คุณภาพสูงโดยเฉพาะอย่างยิ่งในพื้นที่ที่คุณสมบัติภาษาหายาก
เกี่ยวกับการเปิดตัว LLAMA4 Mark Zuckerberg CEO ของ Meta เปิดเผยในการให้สัมภาษณ์ว่าทีมได้เริ่มฝึกอบรมล่วงหน้าสำหรับ Llama4 นอกจากนี้เขายังกล่าวว่า Meta กำลังสร้างคลัสเตอร์คอมพิวเตอร์และโครงสร้างพื้นฐานข้อมูลสำหรับ Llama4 ซึ่งคาดว่าจะเป็นการปรับปรุงที่สำคัญ Paluri กล่าวอย่างตลกขบขันว่าหาก Zuckerberg ถูกถามเมื่อมีการปล่อยตัวเขาอาจพูดว่า“ วันนี้” เน้นความก้าวหน้าอย่างรวดเร็วของ บริษัท ในการพัฒนา AI
Meta หวังว่าจะยังคงเปิดตัวรุ่น Llama ใหม่ในอีกไม่กี่เดือนข้างหน้าเพื่อปรับปรุงความสามารถของ AI อย่างต่อเนื่อง ด้วยการอัปเดตบ่อยครั้งนักพัฒนาสามารถคาดหวังการอัพเกรดที่สำคัญในแต่ละรุ่น
ประเด็นสำคัญ:
- Meta หัวหน้านักวิทยาศาสตร์ AI เชื่อว่าหน่วยสืบราชการลับของเครื่องจักรอัตโนมัติจะช่วยปรับปรุงชีวิตประจำวัน
-โมเดล Llama จะรวมการเรียนรู้ที่ดูแลตนเองและการเรียนรู้การเสริมแรงเพื่อปรับปรุงความสามารถในการใช้เหตุผลหลายสนาม
- การฝึกอบรมล่วงหน้าสำหรับ LLAMA4 ได้เริ่มขึ้นแล้วและคาดว่าจะเปิดตัวประมาณปี 2568
โดยรวมแล้วการลงทุนและนวัตกรรมอย่างต่อเนื่องของ Meta ในรูปแบบ Llama แสดงให้เห็นถึงความทะเยอทะยานในด้านปัญญาประดิษฐ์ การพัฒนาในอนาคตของโมเดล Llama นั้นคุ้มค่าที่จะรอคอยและความสามารถที่ได้รับการปรับปรุงอย่างต่อเนื่องจะมีอิทธิพลต่อวิธีการใช้ชีวิตของผู้คนและทำงานอย่างลึกซึ้ง