La société mère de Tumblr, Automattic, prévoit de vendre les données des publications des utilisateurs à OpenAI et Midjourney pour la formation des modèles d'IA, une décision qui soulève des inquiétudes quant à la confidentialité des utilisateurs et à la sécurité des données. Ceci est similaire aux cas précédents de coopération entre des sociétés telles que Reddit et Shutterstock et des sociétés d’IA, impliquant toutes deux l’utilisation commerciale des données des utilisateurs. Automattic promet de fournir aux utilisateurs des paramètres permettant de refuser le partage de données, mais il existe encore de nombreuses ambiguïtés quant à la portée des méthodes de collecte et de traitement des données, notamment en ce qui concerne le traitement des publications non publiques collectées accidentellement, ce qui nécessite des éclaircissements et des explications supplémentaires.
La société mère de Tumblr, Automattic, est en pourparlers avec OpenAI et Midjourney pour vendre des publications d'utilisateurs pour la formation de modèles d'IA. Automattic se prépare à publier un paramètre qui permettra aux utilisateurs de désactiver le partage de données avec des tiers. Ils ont exploré toutes les publications publiques sur Tumblr de 2014 à 2023. Bien que les erreurs incluent certaines publications non publiques, il n'est pas clair comment les données seront traitées et quelles données seront utilisées pour entraîner le modèle. Auparavant, Reddit avait signé un accord avec Google pour utiliser les données des utilisateurs pour entraîner le modèle d'IA de Google chaque année ; Shutterstock avait signé un accord avec OpenAI pour utiliser sa photothèque pour entraîner le modèle.Cette décision met une fois de plus en évidence la réalité selon laquelle la formation de grands modèles de langage repose sur des quantités massives de données et soulève également des préoccupations persistantes concernant la confidentialité et l'éthique des données. Automattic doit expliquer de manière transparente ses processus de traitement des données et garantir aux utilisateurs un véritable choix afin de maintenir la confiance des utilisateurs et le développement durable de la plateforme. À l’avenir, des pratiques similaires de partage de données seront soumises à une réglementation plus stricte et à un examen public plus large.