法庭文件顯示Meta 高層沉迷於在內部擊敗OpenAI 的GPT-4 - AI文章

作者：Eve Cole 更新時間：2025-01-26 12:32:01

本文揭露了Meta在開發Llama3過程中，內部競爭的激烈程度以及由此引發的潛在版權問題。透過法院公佈的內部消息，我們可以看到Meta為了超越OpenAI和Anthropic，付出了巨大的努力，甚至不惜冒險使用可能有版權問題的訓練資料。這篇文章將詳細分析Meta內部的競爭態勢、對競爭對手的態度、以及由此產生的法律風險和未來展望。

在Meta 正在進行的人工智慧版權案件之一Kadrey v. Meta 中，法院公佈的內部消息揭示了該公司在開發Llama3 時的激烈競爭和潛在版權問題。 Meta的高層領導和研究人員全力以赴，試圖在AI模型開發中超越OpenAI 和Anthropic 等公司，並將其GPT-4 和Claude 視為努力的黃金標準。

激烈的競爭心態:Meta誓言打敗OpenAI

據Meta生成AI副總裁Ahmad Al-Dahle 透露，該公司在開發Llama3 時的目標明確指向GPT-4，並決心透過高效的硬體支持，如64k GPU，在AI競爭中占得先機。 Al-Dahle在一條內部信息中寫道：“我們將推出64k GPU!我們需要學習如何建立前沿並贏得這場比賽。”

然而，儘管Meta發布了開放原始碼的AI模型，Meta的高層更專注於打敗那些通常不會公開其模型權重的競爭對手，如OpenAI 和Anthropic，而是將它們的模型置於API之下，形成了強烈的競爭焦點。

Facebook 元宇宙 meta

對Mistral的輕視與內在焦慮

法國人工智慧新創公司Mistral 是Meta最大的公開競爭對手之一，但Meta高層對此顯然不屑一顧。在一條訊息中，Al-Dahle稱:「米斯特拉爾對我們來說微不足道，我們應該能夠做得更好。」這也暴露了Meta內部對AI競爭的極度焦慮，以及他們在行業中的強烈企圖心。

同時，Meta的AI領導們在內部交流中頻繁談到他們如何積極獲取數據以訓練Llama3，且某些信息表明，高管們對於Llama3 充滿期待，一位高管甚至在信息中提到:“Llama3才是我真正關心的一切。

版權問題與法律挑戰

隨著Meta在開發Llama3的過程中所遭遇的激烈競爭，其所使用的訓練資料也開始引發法律爭議。檢察官指控，Meta的高層在激烈追趕AI開發進度時，可能偷工減料並使用了受版權保護的書籍作為訓練資料。

在一條訊息中，研究員Hugo Touvron 透露，Meta曾在Llama2 訓練中使用的數據集組合“很糟糕”，並提出通過改進數據集來優化Llama3。他們也討論了掃清使用LibGen 資料集的障礙，這個資料集包含瞭如Cengage Learning、Macmillan Learning、McGraw Hill 和Pearson Education 等出版商的版權作品。

儘管存在版權問題，Meta CEO 馬克·祖克柏強調，Meta將繼續推動Llama 模型的進步，並縮小與其他封閉模型如OpenAI 和Google 之間的差距。

Meta的未來展望與Llama3的市場地位

2024年7月，祖克柏表示， Llama3 在性能上已與最先進的AI模型相媲美，並在某些領域處於領先地位。他預計，從2025年起，Meta的Llama 系列將成為業界最先進的AI模型。然而，Llama3 的發布仍需應對不斷加劇的版權訴訟，特別是由它的訓練資料引發的法律審查。

總而言之，Meta在Llama3的開發過程中展現了其在AI領域的野心和競爭力，但也暴露出其在數據獲取和版權合規方面的問題。未來Llama3的市場地位和Meta的AI策略將很大程度上取決於其能否有效解決這些法律挑戰。