Les dirigeants de Meta sont obsédés par le dépassement de GPT-4, et les données de formation font face à des litiges en matière de droits d'auteur ! - Articles sur l'IA

Auteur：Eve Cole Date de mise à jour：2025-01-30 00:32:01

Cet article analyse les informations divulguées à partir des documents internes de Meta, révélant l'intensité de la concurrence interne de Meta et sa forte volonté de surpasser OpenAI GPT-4 lors du développement du grand modèle Llama3. Ces informations proviennent d'un procès concernant les droits d'auteur sur l'intelligence artificielle. Les documents dévoilés par le tribunal montrent les discussions internes et les processus décisionnels des dirigeants de Meta en termes d'acquisition de données, d'amélioration des performances du modèle et de comparaison avec les concurrents, soulignant leur poursuite des pressions et des pressions. défis pour le leadership technologique.

Récemment, les e-mails internes de la société Meta concernant le développement de Llama3 ont été rendus publics, révélant les efforts et les difficultés rencontrés par les dirigeants de l'entreprise pour surpasser le modèle GPT-4 d'OpenAI. Dans l'e-mail, les dirigeants de Meta ont exprimé leur fort désir de surpasser leurs concurrents et de rechercher activement des moyens d'améliorer les performances du modèle, même au risque d'utiliser des données protégées par le droit d'auteur. Cependant, cette ruée a également conduit à des poursuites en matière de droits d'auteur. Bien que Llama3 ait finalement été publié et ait obtenu de bons résultats, il y avait derrière cela une pression et des risques énormes. Grâce à la divulgation de ces documents internes, nous pouvons mieux comprendre l'intensité de la concurrence entre les grandes entreprises technologiques dans le domaine de l'intelligence artificielle, ainsi que les stratégies qu'elles adoptent et les défis auxquels elles sont confrontées dans leur quête du leadership technologique.

Meta，元宇宙，Facebook

Bien que Meta publie des modèles d'IA ouverts, le leadership de l'entreprise en matière d'IA se concentre apparemment davantage sur les concurrents qui ne divulguent pas la pondération des modèles, tels qu'Anthropic et OpenAI, et considèrent leurs Claude et GPT-4 comme des normes de travail. Bien que la startup française d’IA Mistral ait été mentionnée à plusieurs reprises, les dirigeants de Meta semblent plutôt dédaigneux à l’égard de son évaluation. "Mistral est un jeu d'enfant pour nous et nous devrions pouvoir faire mieux", a déclaré Al-Dah dans le message.

Dans le domaine de l'IA, les grandes entreprises rivalisent pour lancer des modèles d'IA avancés, et ces documents judiciaires montrent la forte tension de Meta dans cette compétition. Dans plusieurs messages, les responsables de l'IA de Meta ont mentionné qu'ils étaient « très actifs » pour obtenir les données nécessaires à l'entraînement des lamas. Un cadre a même déclaré : « Llama3 est la seule chose qui m'intéresse. » Ils ont discuté de la manière d'améliorer l'ensemble de données pour améliorer les performances de Llama3.

Cependant, les procureurs dans l'affaire ont allégué que les dirigeants de Meta auraient pu commettre des omissions dans l'utilisation des données dans leur précipitation pour lancer des modèles d'IA, impliquant certains livres protégés par le droit d'auteur. Touvron a mentionné que la combinaison d’ensembles de données de Llama2 « ne fonctionnait pas bien » et a expliqué comment Llama3 pourrait être amélioré avec de meilleures sources de données. Al-Dah a demandé : « Avons-nous le bon ensemble de données ? Y a-t-il quelque chose que nous ne pouvons pas utiliser pour des raisons stupides ?

Le PDG de Meta, Mark Zuckerberg, a déjà exprimé ses efforts pour réduire l'écart de performances entre le modèle Llama et les modèles fermés d'OpenAI, de Google et d'autres sociétés. Ces sources internes révèlent que Meta subit une pression intense pour poursuivre cet objectif. Zuckerberg a mentionné dans une lettre de juillet 2024 : « Cette année, Llama3 est compétitif parmi les modèles les plus avancés et est en tête dans certains domaines. »

En avril 2024, Meta a finalement publié Llama3. Ce modèle d'IA ouvert a bien fonctionné dans la concurrence, surpassant les options ouvertes de Mistral, mais les données utilisées pour entraîner le modèle auraient été obtenues par Zuckerberg. L'approbation fait l'objet d'un examen minutieux de la part de plusieurs. poursuites.

Souligner:

Les dirigeants de Meta se sont concentrés sur le dépassement du modèle GPT-4 d’OpenAI lors du développement de Llama3.

La société a été agressive dans l'acquisition de données, mais a été accusée d'utiliser des données soumises à des droits d'auteur.

Zuckerberg s'attend à ce que les futurs modèles Llama soient les options les plus avancées de l'industrie.

Dans l’ensemble, le processus de développement de Llama3 par Meta reflète la concurrence féroce dans le domaine de l’intelligence artificielle et expose également les risques juridiques et éthiques auxquels peuvent être confrontés la recherche de vitesse et de leadership. À l’avenir, la manière d’équilibrer le développement technologique et la conformité deviendra une question importante dans le secteur de l’intelligence artificielle.