この記事は、Meta の内部文書から漏洩した情報を分析し、Llama3 大型モデルの開発中の Meta の内部競争の激しさと OpenAI GPT-4 を超えたいという強い願望を明らかにします。この情報は、人工知能の著作権に関する訴訟から得られたもので、裁判所によって公開された文書には、データ取得、モデルのパフォーマンス向上、競合他社との比較に関するメタ幹部の内部議論と意思決定プロセスが示されており、圧力と競争力の追求が強調されています。技術的リーダーシップに対する課題。
最近、Llama3 の開発に関する Meta 社の社内メールが公開され、OpenAI の GPT-4 モデルを超えるために会社幹部が直面している努力と困難が明らかになりました。この電子メールの中で、Meta の幹部らは、著作権で保護されたデータを使用するリスクを冒してでも、競合他社を上回り、モデルのパフォーマンスを向上させる方法を積極的に模索したいという強い願望を表明しました。しかし、このラッシュは著作権訴訟にもつながりました。 Llama3 はついにリリースされ好成績を収めましたが、その裏には大きなプレッシャーとリスクが潜んでいました。 これらの内部文書の開示を通じて、私たちは人工知能分野における大手テクノロジー企業間の競争の激しさ、テクノロジーのリーダーシップを追求するために採用する戦略と直面する課題についてより深く理解することができます。
Meta はオープン AI モデルをリリースしていますが、同社の AI リーダーシップは、Anthropic や OpenAI など、モデルの重みを開示せず、自社の Claude と GPT-4 を実用的な標準と見なしている競合他社に重点を置いているようです。フランスのAIスタートアップMistralについては何度も言及されているが、Metaの幹部らはその評価をかなり否定しているようだ。アルダー氏はメッセージの中で、「ミストラルは我々にとって朝飯前で、もっと良くできるはずだ」と語った。
AIの分野では、大手企業が先進的なAIモデルの発売を目指して競い合っており、これらの法廷文書はこの競争におけるメタ社の高い緊張感を示している。 MetaのAIリーダーらは複数のメッセージの中で、ラマの訓練に必要なデータの取得に「非常に積極的」であると述べた。ある幹部は「私が気にしているのは Llama3 だけだ」とさえ言い、彼らは Llama3 のパフォーマンスを向上させるためにデータセットを改善する方法を議論しました。
しかし、この事件の検察当局は、メタ幹部が著作権で保護された書籍の一部に関わるAIモデルの立ち上げを急ぐあまり、データの利用に不作為を犯した可能性があると主張した。 Touvron 氏は、Llama2 のデータセットの組み合わせが「うまく機能しなかった」と述べ、より良いデータソースを使用して Llama3 をどのように改善できるかについて議論しました。アルダー氏は「適切なデータセットはあるのか?愚かな理由で使えないものはあるのか?」と尋ねた。
Meta CEOのMark Zuckerberg氏は以前、LlamaモデルとOpenAI、Google、その他の企業のクローズドソースモデルとのパフォーマンスの差を縮める取り組みを表明していた。これらの内部情報源は、メタがこの目標を追求するという強い圧力を受けていることを明らかにしています。ザッカーバーグ氏は2024年7月の書簡で「今年、Llama3は最先端モデルの中でも競争力があり、いくつかの分野でリードしている」と述べた。
2024年4月、メタ社はついにLlama3をリリースし、このオープンAIモデルはミストラル社のオープンオプションを上回って好成績を収めたが、モデルのトレーニングに使用されたデータはザッカーバーグ氏が入手したものだとされており、この承認は複数の機関から厳しい監視の対象となっている。訴訟。
ハイライト:
Meta の幹部は、Llama3 の開発中に OpenAI の GPT-4 モデルを超えることに重点を置きました。
同社はデータの取得に積極的に取り組んできたが、著作権で制限されたデータを使用したとして非難に直面している。
ザッカーバーグ氏は、将来の Llama モデルが業界で最も先進的なオプションになると予想しています。
全体として、Meta の Llama3 開発プロセスは、人工知能分野における熾烈な競争を反映しており、スピードとリーダーシップを追求する際に直面する可能性のある法的および倫理的リスクも明らかにしています。 今後、人工知能業界では技術開発とコンプライアンスのバランスをどう取るかが重要な課題となる。