تخطط شركة Automattic، الشركة الأم لـ Tumblr، لبيع بيانات منشورات المستخدم إلى OpenAI وMidjourney للتدريب على نماذج الذكاء الاصطناعي، وهي خطوة تثير مخاوف بشأن خصوصية المستخدم وأمن البيانات. وهذا يشبه حالات التعاون السابقة بين شركات مثل Reddit وShutterstock وشركات الذكاء الاصطناعي، وكلاهما ينطوي على الاستخدام التجاري لبيانات المستخدم. يعد Automattic بتزويد المستخدمين بإعدادات لإلغاء الاشتراك في مشاركة البيانات، ولكن لا يزال هناك الكثير من الغموض حول نطاق جمع البيانات وطرق معالجتها، خاصة فيما يتعلق بالتعامل مع المنشورات غير العامة التي تم جمعها عن طريق الخطأ، الأمر الذي يتطلب مزيدًا من التوضيح والتوضيح.
تجري شركة Automattic، الشركة الأم لـ Tumblr، محادثات مع OpenAI وMidjourney لبيع منشورات للمستخدمين لتدريب نماذج الذكاء الاصطناعي. يستعد Automattic لإصدار إعداد يسمح للمستخدمين بإلغاء الاشتراك في مشاركة البيانات مع أطراف ثالثة. لقد قاموا بالزحف إلى جميع المنشورات العامة على Tumblr من عام 2014 إلى عام 2023. وعلى الرغم من أن الأخطاء تتضمن بعض المنشورات غير العامة، إلا أنه ليس من الواضح كيف ستتم معالجة البيانات وما هي البيانات التي سيتم استخدامها لتدريب النموذج. في السابق، وقعت Reddit اتفاقية مع Google لاستخدام بيانات المستخدم لتدريب نموذج Google للذكاء الاصطناعي كل عام؛ ووقعت Shutterstock اتفاقية مع OpenAI لاستخدام مكتبة الصور الخاصة بها لتدريب النموذج.تسلط هذه الخطوة الضوء مرة أخرى على حقيقة أن تدريب النماذج اللغوية الكبيرة يعتمد على كميات هائلة من البيانات، وتثير أيضًا مخاوف مستمرة بشأن خصوصية البيانات وأخلاقياتها. تحتاج شركة Automattic إلى شرح عمليات معالجة البيانات الخاصة بها بشفافية والتأكد من أن المستخدمين لديهم خيار حقيقي من أجل الحفاظ على ثقة المستخدم والتنمية المستدامة للمنصة. وفي المستقبل، ستواجه ممارسات مشاركة البيانات المماثلة تنظيمًا أكثر صرامة وتدقيقًا عامًا أوسع.