وفقًا لـ 404 Media، تخطط Automattic لمشاركة بيانات المنشورات العامة على منصة Tumblr من عام 2014 إلى عام 2023، بما في ذلك المحتوى غير المرئي للعامة، إلى أطراف ثالثة، والتي قد تشمل شركات الذكاء الاصطناعي مثل Midjourney وOpenAI. وأثارت هذه الخطوة مناقشات حول خصوصية البيانات وحق المستخدمين في المعرفة، بينما كشفت أيضًا عن العلاقة المعقدة بين احتياجات شركات الذكاء الاصطناعي للتدريب على كميات هائلة من البيانات واستراتيجيات مشاركة البيانات الخاصة بشركات المنصات. إن "تفريغ البيانات الأولية" هذا كبير جدًا لدرجة أنه يغطي جميع المنشورات العامة على منصة Tumblr، مما سيكون له تأثير كبير على تدريب نماذج الذكاء الاصطناعي.
وفقًا لتقرير صادر عن 404 Media، تخطط Automattic لمشاركة البيانات مع أطراف ثالثة، بما في ذلك بيانات التدريب التي تم الحصول عليها من منشورات المستخدمين. قامت الشركة بجمع "مستودع بيانات أولي" يحتوي على محتوى جميع المنشورات العامة على Tumblr بين عامي 2014 و2023، بما في ذلك المحتوى الذي لن يكون مرئيًا للعامة على المدونة. ومن غير الواضح مقدار هذه البيانات التي تم إرسالها إلى Midjourney وOpenAI. ويشير هذا إلى أن شركة Automattic تجري محادثات مع شركة الذكاء الاصطناعي وأن الصفقة على وشك الانتهاء.أثارت خطوة Automattic مخاوف بشأن خصوصية البيانات وموافقة المستخدم. وستصبح كيفية الموازنة بين تطوير الذكاء الاصطناعي وحماية بيانات المستخدم قضية مهمة في المستقبل. تذكرنا هذه الحادثة أيضًا أننا بحاجة إلى توخي الحذر بشأن الكشف عن المعلومات الشخصية عند استخدام منصات التواصل الاجتماعي.