Недавно средства массовой информации сообщили, что Nvidia тайно собирала видеоданные YouTube в больших масштабах для обучения своей модели искусственного интеллекта, что вызвало широкомасштабные юридические и этические споры. Этот шаг затрагивает многие продукты Nvidia для искусственного интеллекта, в том числе модель глубокого обучения Cosmos, алгоритмы автономного вождения и т. д. Метод сбора данных скрыт и не требует разрешения создателя видео и Google. Внутренние электронные письма NVIDIA показывают, что высшее руководство с оптимизмом смотрит на такое поведение и считает, что оно «полностью одобрено». Это заявление противоречит официальному заявлению Google, в котором четко указано, что такое поведение нарушает условия обслуживания платформы. Огромный объем задействованных данных, секретные методы работы и совершенно разные реакции всех сторон сделали этот инцидент тревожным.
Недавно была раскрыта секретная операция технологического гиганта Nvidia по сбору данных. По сообщениям СМИ 404, Nvidia обучила свою модель искусственного интеллекта, перехватив огромные объемы видеоданных YouTube, что весьма неоднозначно с точки зрения закона и этики.
В отчете отмечается, что Nvidia использует эти видеоданные для обучения своих многочисленных моделей искусственного интеллекта, включая модели глубокого обучения Cosmos, алгоритмы автономного вождения, продукты для цифровых человеческих аватаров с искусственным интеллектом и инструмент для построения трехмерного мира Omniverse.
Понятно, что Nvidia приняла множество скрытых мер, чтобы скрыть свое поведение по сбору данных, используя несколько «виртуальных машин» и постоянно меняя IP-адреса, чтобы YouTube не обнаружил их. Более того, создатель видео и материнская компания YouTube Google не давали никакого разрешения на эту деятельность по сбору данных. Внутренние коммуникации Nvidia показывают, что их стратегия довольно смелая. Один из руководителей упомянул в электронном письме, что они строят «фабрику видеоданных», которая может ежедневно генерировать данные о визуальном опыте, эквивалентные продолжительности жизни человека.
Интересно, что когда сотрудники выразили обеспокоенность по поводу законности и этичности такого сбора данных, руководство выглядело вполне уверенным, полагая, что все это было решением на высоком уровне. «У нас есть полное одобрение всех данных», — говорится в электронном письме.
Еще более тревожным является то, что Nvidia уже некоторое время знала, что использует набор данных HD-VG-130M, содержащий 130 миллионов видеороликов YouTube, который изначально был создан для академических исследований. Многие эксперты выразили резкое недовольство этим, утверждая, что коммерциализация данных, используемых для исследований, нецелесообразна.
Являясь ключевым игроком в индустрии искусственного интеллекта, NVIDIA занимает видное положение на рынке, а ее графические процессоры (GPU) являются основой для многих вычислительно-интенсивных систем искусственного интеллекта. Компании, работающие с Nvidia, такие как OpenAI, Microsoft и Google, выразили обеспокоенность по поводу такого поведения. Представитель Google отметил, что использование данных YouTube без разрешения является явным нарушением условий обслуживания платформы.
В ответ на сообщение СМИ Nvidia заявила, что их практика обучения искусственному интеллекту «полностью соответствует духу и букве закона об авторском праве». Однако что думают об этом заявлении создатели, использующие этот контент?
Выделять:
Nvidia тайно собрала большое количество видеоданных YouTube для обучения искусственному интеллекту, что вызвало обеспокоенность по поводу юридических и этических проблем.
? Внутренние электронные письма показывают, что руководители Nvidia полагали, что такое поведение было полностью одобрено, и их позиция была довольно смелой.
Google отметил, что использование данных YouTube без разрешения явно нарушает условия обслуживания платформы, и ответ Nvidia вызвал споры.
Действия NVIDIA по сбору данных вызвали широкие дискуссии об этике и законах сбора данных ИИ, но ее реакция не смогла подавить споры. Этот инцидент подчеркивает проблемы, с которыми сталкиваются крупные технологические компании при использовании данных, а также острую необходимость совершенствования соответствующих законов и правил. В будущем подобные инциденты могут продолжать привлекать внимание и побуждать отрасль укреплять самодисциплину и стандартизировать поведение при использовании данных.