Cet article révèle l'intensité de la concurrence interne chez Meta lors du développement de Llama3 et les problèmes potentiels de droits d'auteur qui en ont résulté. Grâce aux informations internes publiées par le tribunal, nous pouvons voir que Meta a fait de grands efforts pour surpasser OpenAI et Anthropic, prenant même des risques en utilisant des données de formation pouvant présenter des problèmes de droits d'auteur. Cet article fournira une analyse détaillée de la situation concurrentielle interne de Meta, de son attitude envers les concurrents, ainsi que des risques juridiques et des perspectives d’avenir qui en résultent.
Dans Kadrey c. Meta, l'une des affaires en cours de Meta en matière de droits d'auteur sur l'intelligence artificielle, des informations internes publiées par le tribunal ont révélé la concurrence féroce de l'entreprise et les problèmes potentiels de droits d'auteur lors du développement de Llama3. Les hauts dirigeants et chercheurs de Meta ont tout mis en œuvre pour surpasser des entreprises comme OpenAI et Anthropic dans le développement de modèles d’IA, et considèrent GPT-4 et Claude comme la référence en matière de leurs efforts.
Mentalité de compétition féroce : Meta promet de vaincre OpenAI
Selon Ahmad Al-Dahle, vice-président de l'IA générative chez Meta, l'objectif de l'entreprise lors du développement de Llama3 était clairement dirigé vers GPT-4, et elle était déterminée à prendre l'avantage dans la concurrence de l'IA grâce à un support matériel efficace, tel que GPU 64k. Al-Dahle a écrit dans un message interne : « Nous allons lancer un GPU 64k ! Nous devons apprendre à construire l'avant-garde et gagner ce jeu. »
Cependant, même si Meta publie des modèles d'IA open source, les dirigeants de Meta s'efforcent davantage de battre des concurrents comme OpenAI et Anthropic, qui ne divulguent généralement pas le poids de leurs modèles, plaçant plutôt leurs modèles sous API, formant ainsi un fort centre de concurrence.
Mépris du Mistral et anxiété intérieure
La startup française d'intelligence artificielle Mistral est l'un des plus grands concurrents publics de Meta, mais les dirigeants de Meta le dédaignent clairement. Dans un message, Al-Dahle a déclaré : « Mistral est insignifiant pour nous, nous devrions être capables de faire mieux. » Cela a également révélé l'extrême anxiété au sein de Meta concernant la concurrence de l'IA et leur rôle dans l'industrie.
Dans le même temps, les responsables de l'IA de Meta ont fréquemment parlé de la façon dont ils obtenaient activement des données pour former Llama3 aux communications internes, et certaines informations ont montré que les dirigeants étaient pleins d'attentes envers Llama3. Un cadre a même mentionné dans le message : « Llama3, c'est tout ce que j'ai vraiment. s'en soucier.
Problèmes de droits d'auteur et défis juridiques
Alors que Meta a été confrontée à une concurrence féroce dans le développement de Llama3, les données d'entraînement utilisées ont également commencé à provoquer des litiges juridiques. Les procureurs affirment que les dirigeants de Meta ont peut-être rogné sur les coûts et utilisé des livres protégés par le droit d'auteur comme données de formation alors qu'ils se précipitaient pour rattraper leur retard dans le développement de l'IA.
Dans un message, le chercheur Hugo Touvron a révélé que la combinaison d'ensembles de données utilisée par Meta dans la formation Llama2 était « terrible » et a proposé d'optimiser Llama3 en améliorant les ensembles de données. Ils ont également discuté de la suppression des obstacles à l'utilisation de l'ensemble de données LibGen, qui contient des œuvres protégées par le droit d'auteur d'éditeurs tels que Cengage Learning, Macmillan Learning, McGraw Hill et Pearson Education.
Malgré les problèmes de droits d'auteur, le PDG de Meta, Mark Zuckerberg, a souligné que Meta continuera à promouvoir les progrès du modèle Llama et à réduire l'écart avec d'autres modèles fermés tels que OpenAI et Google.
Perspectives d’avenir de Meta et position de Llama3 sur le marché
En juillet 2024, Zuckerberg a déclaré que Llama3 était comparable en termes de performances aux modèles d'IA les plus avancés et était en tête dans certains domaines. Il prédit qu’à partir de 2025, la série Llama de Meta deviendra le modèle d’IA le plus avancé du secteur. Cependant, la sortie de Llama3 doit encore faire face à des litiges croissants en matière de droits d'auteur, en particulier un contrôle juridique sur ses données d'entraînement.
Dans l’ensemble, Meta a démontré son ambition et sa compétitivité dans le domaine de l’IA lors du développement de Llama3, mais a également exposé ses problèmes d’acquisition de données et de respect des droits d’auteur. La position future de Llama3 et de la stratégie d'IA de Meta sur le marché dépendra largement de sa capacité à résoudre efficacement ces défis juridiques.