404 Media에 따르면 Automattic은 비공개 콘텐츠를 포함하여 2014년부터 2023년까지 Tumblr 플랫폼의 공개 게시물 데이터를 Midjourney 및 OpenAI와 같은 인공 지능 회사를 포함할 수 있는 제3자와 공유할 계획입니다. 이번 조치는 데이터 프라이버시와 사용자의 알 권리에 대한 논의를 촉발시켰으며, 인공지능 기업의 대용량 데이터 교육 요구와 플랫폼 기업의 데이터 공유 전략 사이의 복잡한 관계를 드러냈습니다. 이 '초기 데이터 덤프'는 너무 커서 Tumblr 플랫폼의 모든 공개 게시물을 포함하므로 인공 지능 모델 훈련에 상당한 영향을 미칠 것입니다.
404 Media의 보고서에 따르면 Automattic은 사용자 게시물에서 얻은 훈련 데이터를 포함하여 제3자와 데이터를 공유할 계획입니다. 회사는 블로그에 공개적으로 표시되지 않는 콘텐츠를 포함하여 2014년부터 2023년까지 Tumblr의 모든 공개 게시물 콘텐츠가 포함된 "초기 데이터 덤프"를 스크랩했습니다. 이 데이터 중 얼마나 많은 양이 Midjourney와 OpenAI로 전송되었는지는 확실하지 않습니다. 이는 오토매틱이 인공지능 기업과 협의 중이며 거래가 거의 완료되었음을 의미한다.Automattic의 움직임은 데이터 프라이버시와 사용자 동의에 대한 우려를 불러일으켰습니다. 인공지능의 발전과 사용자 데이터 보호 사이의 균형을 어떻게 맞추느냐가 앞으로 중요한 문제가 될 것입니다. 이번 사건은 또한 우리가 소셜 미디어 플랫폼을 사용할 때 개인 정보 공개에 주의해야 한다는 점을 상기시켜 줍니다.