Недавно обучение китайского корпуса Gemini-Pro от Google вызвало бурные дискуссии. Компания признала, что использовала данные Baidu Wenxin Yiyan для обучения, что вызвало бурю негодования в социальных сетях. Многие пользователи сети задавались вопросом, существует ли недобросовестная конкуренция между крупными компаниями, что вызвало дискуссии об источниках и этике данных обучения моделей искусственного интеллекта. Суть инцидента заключается в том, что Gemini-Pro полагалась на данные Baidu Wenxinyyan при обучении китайского корпуса. Это напрямую поставило под угрозу границы отрасли в отношении владения данными и прав интеллектуальной собственности, а также выявило возможные риски и скрытые опасности при крупномасштабном обучении языковым моделям. .
В статье основное внимание уделяется:
Китайский корпус Google Gemini-Pro вызвал споры. Выяснилось, что он использовал Baidu Wenxinyyan для обучения. Пользователи сети задавались вопросом, не пытаются ли крупные компании украсть шерсть друг друга. Gemini-Pro привлек внимание социальных сетей после того, как во время тестирования он не смог определить свою идентичность. Представители Gemini наконец признались, что использовали Baidu Wenxin для сбора данных по обучению китайцев, что еще больше обострило тему.
Этот инцидент не только подчеркивает противоречие между совместным использованием ресурсов данных и защитой интеллектуальной собственности в области искусственного интеллекта, но также вызывает обеспокоенность по поводу достоверности и прозрачности больших языковых моделей. В будущем обучение и применение моделей искусственного интеллекта потребуют более стандартизированного управления и более строгих этических стандартов для обеспечения здорового развития отрасли.