Проблемы с авторскими правами на данные обучения больших моделей ИИ подчеркивают ценность высококачественных баз данных обучения, которые могут быть переоценены

Автор：Eve Cole Время обновления：2025-02-03 15:00:03

В последнее время гиганты в области искусственного интеллекта строили планы и часто предпринимали шаги в области сбора данных и технического сотрудничества. В этой статье мы сосредоточимся на нескольких важных новостях и проанализируем их влияние на развитие и будущие тенденции индустрии искусственного интеллекта. Эта новость касается крупного соглашения Reddit с Google и углубленного сотрудничества OpenAI с несколькими издательскими организациями, демонстрируя огромный спрос на высококачественные данные для обучения больших моделей и ключевую роль, которую играет в этом издательская индустрия. Это сотрудничество не только дает новый импульс развитию искусственного интеллекта, но и указывает на то, что приобретение и использование ресурсов данных в будущем будут более стандартизированы и коммерциализированы.

По словам людей, знакомых с ситуацией, у Reddit и Google есть соглашение стоимостью около 60 миллионов долларов в год. Springer Publishing Group заключила партнерское соглашение с OpenAI, чтобы стать первой издательской организацией, глубоко интегрировавшей журналистику и технологии искусственного интеллекта. Сотрудничество OpenAI с Акселем Спрингером показывает, что обучение крупных моделей может потребовать платного доступа к данным. Компании издательской индустрии располагают богатыми электронными графическими и текстовыми ресурсами, которые могут стать важными большими наборами данных для обучения моделей. CITIC Publishing пытается сотрудничать с авторами и крупными модельными компаниями для обучения языку, а Palm Reading Technology ведет углубленное сотрудничество с Byte в таких аспектах, как авторское право и производство контента.

Из приведенных выше примеров видно, что индустрия искусственного интеллекта находится в стадии бурного развития, а конкуренция за ресурсы данных становится все более жесткой. В будущем методы получения и использования данных претерпят глубокие изменения, которые будут происходить. также привносят новые возможности и вызовы в издательскую индустрию.