В последние годы обучение моделей искусственного интеллекта все чаще опирается на сбор сетевых данных. Отношение новостных веб-сайтов к сканерам искусственного интеллекта напрямую влияет на эффект обучения модели. В этой статье будут проанализированы результаты исследования новостных веб-сайтов, блокирующих сканеры OpenAI, а также изучены причины и потенциальные последствия этого.
Одно исследование показало, что почти половина популярных новостных веб-сайтов заблокировали сканеры OpenAI. Веб-сайты традиционных печатных СМИ более заблокированы для сканеров OpenAI, а новые модели ИИ могут испытывать деградацию при обучении на предыдущих моделях. Сканеры с искусственным интеллектом используются для сбора данных для обучения языковых моделей, а новостные организации в странах северного полушария более склонны блокировать сканеры с искусственным интеллектом.
Результаты проливают свет на растущую напряженность между новостными веб-сайтами и обучением моделей искусственного интеллекта. Поведение новостных веб-сайтов, блокирующих сканеры, может привести к снижению качества данных обучения модели искусственного интеллекта, тем самым влияя на производительность и надежность модели. В будущем важной темой станет то, как сбалансировать потребности в обучении моделей искусственного интеллекта и защиту прав и интересов новостных сайтов. Необходимо изучить более эффективные модели сотрудничества для содействия развитию технологий искусственного интеллекта при соблюдении прав интеллектуальной собственности и безопасности данных новостных организаций.