Selon 404 Media, Automattic prévoit de partager les données des publications publiques sur la plateforme Tumblr de 2014 à 2023, y compris le contenu non visible publiquement, avec des tiers, qui peuvent inclure des sociétés d'intelligence artificielle telles que Midjourney et OpenAI. Cette décision a suscité des discussions sur la confidentialité des données et le droit des utilisateurs à l’information, tout en révélant la relation complexe entre les besoins de formation des entreprises d’intelligence artificielle sur des quantités massives de données et les stratégies de partage de données des entreprises de plateformes. Ce « dump de données initial » est si important qu'il couvre toutes les publications publiques sur la plateforme Tumblr, ce qui aura un impact significatif sur la formation des modèles d'intelligence artificielle.
Selon un rapport de 404 Media, Automattic prévoit de partager des données avec des tiers, y compris des données de formation obtenues à partir des publications des utilisateurs. La société a récupéré un « vidage de données initial » contenant le contenu de toutes les publications publiques sur Tumblr entre 2014 et 2023, y compris le contenu qui ne serait pas visible publiquement sur le blog. On ne sait pas quelle quantité de ces données a été envoyée à Midjourney et OpenAI. Cela indique qu'Automattic est en pourparlers avec la société d'intelligence artificielle et que l'accord est sur le point d'être conclu.La décision d'Automattic a soulevé des inquiétudes quant à la confidentialité des données et au consentement des utilisateurs. Comment équilibrer le développement de l'intelligence artificielle et la protection des données des utilisateurs deviendra une question importante à l'avenir. Cet incident nous rappelle également que nous devons être prudents quant à la divulgation de renseignements personnels lors de l’utilisation des plateformes de médias sociaux.