人工智慧領域競爭激烈,開源模型的崛起正挑戰科技巨頭的統治地位。近日,人工智慧硬體新創公司Groq發布了兩款開源語言模型——Llama-3-Groq-70B-Tool-Use和Llama3Groq Tool Use 8B,並在伯克利函數調用排行榜(BFCL)上取得了令人矚目的成績,其中70B參數版本更是超越了OpenAI、Google和Anthropic等公司的專有模型。這些模型的成功,不僅在於其強大的性能,更在於其在訓練過程中使用了道德生成的合成數據,有效解決了數據隱私和過度擬合等問題,為人工智慧領域的可持續發展提供了新的範例。
人工智慧硬體新創公司Groq發布了兩款開源語言模型,這兩款模型在專門工具使用能力方面勝過科技巨頭。新的Llama-3-Groq-70B-Tool-Use 模型已經在伯克利函數調用排行榜(BFCL)上奪得榜首,超越了來自OpenAI、谷歌和Anthropic 等公司的專有產品。
Groq 的專案負責人Rick Lamers 在一篇X.com 的文章中宣布了這項突破。他說:「我很自豪地宣布Llama3Groq Tool Use8B 和70B 模型。這是Llama3的一個開源工具使用全精調版本,在BFCL 上達到了第一名的位置,擊敗了所有其他模型,包括專有模型如Claude Sonnet3.5、GPT-4Turbo、GPT-4o 和Gemini1.5Pro。
合成資料與道德人工智慧:模型訓練中的新典範
較大的70B 參數版本在BFCL 上達到了90.76% 的整體準確率,而較小的8B 模型得分為89.06%,在總體上排名第三。這些結果表明,開源模型在特定任務中可以與甚至超越封閉源替代品的性能。
Groq 與人工智慧研究公司Glaive 合作開發了這些模型,使用了Meta 的Llama-3基礎模型上的全精細調和直接偏好優化(DPO)。團隊強調他們只使用道德生成的合成資料進行訓練,解決了關於資料隱私和過度擬合的常見擔憂。
這些模型現在透過Groq API 和Hugging Face 平台提供。這種可訪問性可以加速需要複雜工具使用和函數呼叫的領域的創新,例如自動編碼、數據分析和互動式人工智慧助理。
Groq 也在Hugging Face Spaces 上推出了一個公開演示,讓使用者可以與模型互動並第一手測試其工具使用能力。和Hugging Face 在2021年12月收購的Gradio 一樣,許多Hugging Face Spaces 上的示範都是這樣製作的。人工智慧社群對此做出了積極回應,許多研究人員和開發人員都急於探索這些模型的能力。
劃重點:
⭐ Groq 發布的開源AI 模型在特定任務中勝過了科技巨頭的專有模型
⭐ 透過使用合成資料訓練,Groq 挑戰了AI 模型開發中常見的資料隱私和過度擬合問題
⭐ 開源模式的推出可能改變AI 領域的發展路徑,促進更廣泛的AI 可訪問性和創新生態系統的培育
Groq 開源模型的成功,為人工智慧領域的發展注入了新的活力,也預示著開源模型將在未來扮演越來越重要的角色。其對合成資料的應用,更在解決資料隱私和模型偏見等問題上提供了新的思路,值得業界深入研究與參考。期待未來更多優秀的開源模型出現,推動人工智慧技術持續進步。