โมเดลโอเพ่นซอร์ส Llama AI ของ Groq ติดอันดับสูงสุด โดยเหนือกว่า GPT-4o และ Claude ในแง่ของการเรียกใช้ฟังก์ชัน

ผู้เขียน：Eve Cole เวลาอัปเดต：2024-12-13 09:48:01

การแข่งขันในสาขาปัญญาประดิษฐ์นั้นดุเดือด และการเพิ่มขึ้นของโมเดลโอเพ่นซอร์สกำลังท้าทายการครอบงำของยักษ์ใหญ่ด้านเทคโนโลยี เมื่อเร็วๆ นี้ บริษัทสตาร์ทอัพฮาร์ดแวร์ปัญญาประดิษฐ์ Groq ได้เปิดตัวโมเดลภาษาโอเพ่นซอร์สสองรุ่น ได้แก่ Llama-3-Groq-70B-Tool-Use และ Llama3Groq Tool Use 8B และบรรลุผลลัพธ์ที่น่าประทับใจใน Berkeley Function Call Ranking (BFCL) ในบรรดาพารามิเตอร์ 70B เวอร์ชันนี้เหนือกว่าโมเดลที่เป็นกรรมสิทธิ์ของ OpenAI, Google, Anthropic และบริษัทอื่นๆ ความสำเร็จของแบบจำลองเหล่านี้ไม่เพียงแต่อยู่ที่ประสิทธิภาพอันทรงพลังเท่านั้น แต่ยังรวมถึงการใช้ข้อมูลสังเคราะห์ที่สร้างขึ้นอย่างมีจริยธรรมในระหว่างกระบวนการฝึกอบรม ซึ่งช่วยแก้ปัญหา เช่น ความเป็นส่วนตัวของข้อมูลและการติดตั้งมากเกินไปได้อย่างมีประสิทธิภาพ และมอบโอกาสใหม่สำหรับการพัฒนาที่ยั่งยืนของภาคสนาม ตัวอย่างของปัญญาประดิษฐ์

Groq สตาร์ทอัพด้านฮาร์ดแวร์ปัญญาประดิษฐ์ได้เปิดตัวโมเดลภาษาโอเพ่นซอร์สสองโมเดลที่มีประสิทธิภาพเหนือกว่ายักษ์ใหญ่ด้านเทคโนโลยีในด้านความสามารถในการใช้เครื่องมือพิเศษ โมเดล Llama-3-Groq-70B-Tool-Use ใหม่ได้ครองตำแหน่งสูงสุดใน Berkeley Function Call Ranking (BFCL) ซึ่งเหนือกว่าผลิตภัณฑ์ที่เป็นกรรมสิทธิ์จาก OpenAI, Google และ Anthropic

Rick Lamers ผู้นำโครงการ Groq ได้ประกาศความก้าวหน้าในบทความของ X.com เขากล่าวว่า: “ผมภูมิใจที่จะประกาศเครื่องมือ Llama3Groq Tool Use 8B และ 70B นี่เป็นเวอร์ชันที่ได้รับการปรับแต่งอย่างสมบูรณ์ของเครื่องมือโอเพ่นซอร์สของ Llama3 ซึ่งขึ้นสู่ตำแหน่งอันดับ 1 ใน BFCL ซึ่งเหนือกว่ารุ่นอื่นๆ ทั้งหมดรวมถึงรุ่นที่เป็นกรรมสิทธิ์ด้วย เช่น Claude Sonnet3.5, GPT-4Turbo, GPT-4o และ Gemini1.5Pro”

ข้อมูลสังเคราะห์และ AI ที่มีจริยธรรม: กระบวนทัศน์ใหม่ในการฝึกโมเดล

รุ่นพารามิเตอร์ 70B ที่ใหญ่กว่าได้รับความแม่นยำโดยรวมที่ 90.76% บน BFCL ในขณะที่รุ่น 8B ที่เล็กกว่าได้คะแนน 89.06% ซึ่งอยู่ในอันดับที่สามโดยรวม ผลลัพธ์เหล่านี้แสดงให้เห็นว่าโมเดลโอเพ่นซอร์สสามารถจับคู่หรือเหนือกว่าประสิทธิภาพของทางเลือกโอเพ่นซอร์สในงานเฉพาะเจาะจงได้

Groq พัฒนาโมเดลดังกล่าวโดยความร่วมมือกับบริษัทวิจัยปัญญาประดิษฐ์ Glaive โดยใช้การปรับแต่งอย่างละเอียดและการเพิ่มประสิทธิภาพการกำหนดลักษณะโดยตรง (DPO) บนโมเดลฐาน Llama-3 ของ Meta ทีมงานเน้นย้ำว่าพวกเขาใช้เฉพาะข้อมูลสังเคราะห์ที่สร้างขึ้นตามหลักจริยธรรมสำหรับการฝึกอบรม โดยจัดการกับข้อกังวลทั่วไปเกี่ยวกับความเป็นส่วนตัวของข้อมูลและการติดตั้งมากเกินไป

โมเดลเหล่านี้มีจำหน่ายแล้วผ่าน Groq API และแพลตฟอร์ม Hugging Face การเข้าถึงนี้สามารถเร่งให้เกิดนวัตกรรมในพื้นที่ที่ต้องใช้เครื่องมือที่ซับซ้อนและการเรียกใช้ฟังก์ชัน เช่น การเขียนโค้ดอัตโนมัติ การวิเคราะห์ข้อมูล และผู้ช่วย AI แบบโต้ตอบ

Groq ยังได้เปิดตัวการสาธิตสาธารณะเกี่ยวกับ Hugging Face Spaces เพื่อให้ผู้ใช้สามารถโต้ตอบกับโมเดลและทดสอบความสามารถในการใช้เครื่องมือได้โดยตรง เช่นเดียวกับ Gradio ซึ่ง Hugging Face เข้าซื้อกิจการในเดือนธันวาคม 2021 การสาธิตจำนวนมากบน Hugging Face Spaces ก็ถูกสร้างขึ้นในลักษณะนี้ ชุมชน AI ตอบสนองอย่างกระตือรือร้น โดยมีนักวิจัยและนักพัฒนาจำนวนมากกระตือรือร้นที่จะสำรวจความสามารถของโมเดลเหล่านี้

ไฮไลท์:

⭐ โมเดล AI แบบโอเพ่นซอร์สที่เผยแพร่โดย Groq มีประสิทธิภาพเหนือกว่าโมเดลที่เป็นกรรมสิทธิ์ของยักษ์ใหญ่ด้านเทคโนโลยีในงานเฉพาะ

⭐ การใช้ข้อมูลสังเคราะห์สำหรับการฝึกอบรม Groq ท้าทายความเป็นส่วนตัวของข้อมูลทั่วไปและปัญหาการติดตั้งมากเกินไปในการพัฒนาโมเดล AI

⭐ การเปิดตัวโมเดลโอเพ่นซอร์สอาจเปลี่ยนเส้นทางการพัฒนาของสาขา AI และส่งเสริมการเข้าถึง AI ในวงกว้างและการพัฒนาระบบนิเวศที่เป็นนวัตกรรม

ความสำเร็จของโมเดลโอเพ่นซอร์ส Groq ได้เพิ่มพลังใหม่ให้กับการพัฒนาด้านปัญญาประดิษฐ์ และยังบ่งชี้ว่าโมเดลโอเพ่นซอร์สจะมีบทบาทสำคัญมากขึ้นในอนาคต การประยุกต์ใช้ข้อมูลสังเคราะห์ทำให้เกิดแนวคิดใหม่ๆ ในการแก้ปัญหาต่างๆ เช่น ความเป็นส่วนตัวของข้อมูลและความลำเอียงของโมเดล ซึ่งสมควรได้รับการศึกษาเชิงลึกและการอ้างอิงโดยอุตสาหกรรม เราหวังว่าจะมีโมเดลโอเพ่นซอร์สที่ยอดเยี่ยมมากขึ้นในอนาคต เพื่อส่งเสริมความก้าวหน้าอย่างต่อเนื่องของเทคโนโลยีปัญญาประดิษฐ์