Laut 404 Media plant Automattic, von 2014 bis 2023 öffentliche Postdaten auf der Tumblr-Plattform, einschließlich nicht öffentlich sichtbarer Inhalte, an Dritte weiterzugeben, darunter möglicherweise Unternehmen für künstliche Intelligenz wie Midjourney und OpenAI. Der Schritt löste Diskussionen über den Datenschutz und das Recht der Nutzer auf Information aus und verdeutlichte gleichzeitig den komplexen Zusammenhang zwischen dem Schulungsbedarf von Unternehmen der künstlichen Intelligenz für riesige Datenmengen und den Datenaustauschstrategien der Plattformunternehmen. Dieser „erste Datendump“ ist so groß, dass er alle öffentlichen Beiträge auf der Tumblr-Plattform abdeckt, was erhebliche Auswirkungen auf das Training von Modellen der künstlichen Intelligenz haben wird.
Laut einem Bericht von 404 Media plant Automattic, Daten mit Dritten zu teilen, darunter auch Trainingsdaten, die aus Benutzerbeiträgen gewonnen wurden. Das Unternehmen hat einen „ersten Daten-Dump“ mit dem Inhalt aller öffentlichen Beiträge auf Tumblr zwischen 2014 und 2023 erstellt, einschließlich Inhalten, die im Blog nicht öffentlich sichtbar wären. Es ist unklar, wie viele dieser Daten an Midjourney und OpenAI gesendet wurden. Dies deutet darauf hin, dass Automattic Gespräche mit dem Unternehmen für künstliche Intelligenz führt und der Deal kurz vor dem Abschluss steht.Der Schritt von Automattic hat Bedenken hinsichtlich des Datenschutzes und der Einwilligung der Nutzer geweckt. Wie die Entwicklung künstlicher Intelligenz und der Schutz der Nutzerdaten in Einklang gebracht werden können, wird in Zukunft ein wichtiges Thema sein. Dieser Vorfall erinnert uns auch daran, dass wir bei der Offenlegung personenbezogener Daten bei der Nutzung von Social-Media-Plattformen vorsichtig sein müssen.