本文揭露了Meta在開發Llama3過程中,內部競爭的激烈程度以及由此引發的潛在版權問題。透過法院公佈的內部消息,我們可以看到Meta為了超越OpenAI和Anthropic,付出了巨大的努力,甚至不惜冒險使用可能有版權問題的訓練資料。這篇文章將詳細分析Meta內部的競爭態勢、對競爭對手的態度、以及由此產生的法律風險和未來展望。
在Meta 正在進行的人工智慧版權案件之一Kadrey v. Meta 中,法院公佈的內部消息揭示了該公司在開發Llama3 時的激烈競爭和潛在版權問題。 Meta的高層領導和研究人員全力以赴,試圖在AI模型開發中超越OpenAI 和Anthropic 等公司,並將其GPT-4 和Claude 視為努力的黃金標準。
激烈的競爭心態:Meta誓言打敗OpenAI
據Meta生成AI副總裁Ahmad Al-Dahle 透露,該公司在開發Llama3 時的目標明確指向GPT-4,並決心透過高效的硬體支持,如64k GPU,在AI競爭中占得先機。 Al-Dahle在一條內部信息中寫道:“我們將推出64k GPU!我們需要學習如何建立前沿並贏得這場比賽。”
然而,儘管Meta發布了開放原始碼的AI模型,Meta的高層更專注於打敗那些通常不會公開其模型權重的競爭對手,如OpenAI 和Anthropic,而是將它們的模型置於API之下,形成了強烈的競爭焦點。
對Mistral的輕視與內在焦慮
法國人工智慧新創公司Mistral 是Meta最大的公開競爭對手之一,但Meta高層對此顯然不屑一顧。在一條訊息中,Al-Dahle稱:「米斯特拉爾對我們來說微不足道,我們應該能夠做得更好。」這也暴露了Meta內部對AI競爭的極度焦慮,以及他們在行業中的強烈企圖心。
同時,Meta的AI領導們在內部交流中頻繁談到他們如何積極獲取數據以訓練Llama3,且某些信息表明,高管們對於Llama3 充滿期待,一位高管甚至在信息中提到:“Llama3才是我真正關心的一切。
版權問題與法律挑戰
隨著Meta在開發Llama3的過程中所遭遇的激烈競爭,其所使用的訓練資料也開始引發法律爭議。檢察官指控,Meta的高層在激烈追趕AI開發進度時,可能偷工減料並使用了受版權保護的書籍作為訓練資料。
在一條訊息中,研究員Hugo Touvron 透露,Meta曾在Llama2 訓練中使用的數據集組合“很糟糕”,並提出通過改進數據集來優化Llama3。他們也討論了掃清使用LibGen 資料集的障礙,這個資料集包含瞭如Cengage Learning、Macmillan Learning、McGraw Hill 和Pearson Education 等出版商的版權作品。
儘管存在版權問題,Meta CEO 馬克·祖克柏強調,Meta將繼續推動Llama 模型的進步,並縮小與其他封閉模型如OpenAI 和Google 之間的差距。
Meta的未來展望與Llama3的市場地位
2024年7月,祖克柏表示, Llama3 在性能上已與最先進的AI模型相媲美,並在某些領域處於領先地位。他預計,從2025年起,Meta的Llama 系列將成為業界最先進的AI模型。然而,Llama3 的發布仍需應對不斷加劇的版權訴訟,特別是由它的訓練資料引發的法律審查。
總而言之,Meta在Llama3的開發過程中展現了其在AI領域的野心和競爭力,但也暴露出其在數據獲取和版權合規方面的問題。未來Llama3的市場地位和Meta的AI策略將很大程度上取決於其能否有效解決這些法律挑戰。