По данным 404 Media, Automattic планирует передавать данные общедоступных публикаций на платформе Tumblr с 2014 по 2023 год, включая непублично видимый контент, третьим сторонам, в число которых могут входить компании по искусственному интеллекту, такие как Midjourney и OpenAI. Этот шаг вызвал дискуссии о конфиденциальности данных и праве пользователей знать, а также выявил сложную взаимосвязь между потребностями компаний, занимающихся искусственным интеллектом, в обучении работе с огромными объемами данных и стратегиями компаний-платформ по обмену данными. Этот «первоначальный дамп данных» настолько велик, что охватывает все публичные публикации на платформе Tumblr, что окажет существенное влияние на обучение моделей искусственного интеллекта.
Согласно сообщению 404 Media, Automattic планирует делиться данными с третьими лицами, включая данные обучения, полученные из постов пользователей. Компания собрала «первоначальный дамп данных», содержащий содержимое всех общедоступных публикаций на Tumblr в период с 2014 по 2023 год, включая контент, который не будет публично виден в блоге. Неясно, какая часть этих данных была отправлена в Midjourney и OpenAI. Это указывает на то, что Automattic ведет переговоры с компанией по искусственному интеллекту и сделка близка к завершению.Решение Automattic вызвало обеспокоенность по поводу конфиденциальности данных и согласия пользователей. Как сбалансировать развитие искусственного интеллекта и защиту пользовательских данных, станет важным вопросом в будущем. Этот инцидент также напоминает нам о том, что нам нужно быть осторожными в отношении раскрытия личной информации при использовании социальных сетей.