Китайский стартап DeepSeek быстро поднялся благодаря своей высокопроизводительной, недорогой генеративной крупномасштабной языковой модели (LLM), привлекая глобальное внимание. Его техническая сила была признана всемирно авторитетными экспертами и, как полагают, в некоторых отношениях превосходит Соединенные Штаты. Эта статья обеспечит углубленную интерпретацию оценки Deepseek о DeepSeek и влиянии DeepSeek на глобальный ландшафт ИИ и изучит значение его стратегии с открытым исходным кодом и рисков безопасности моделей ИИ.
Высокопроизводительная, недорогая генеративная крупномасштабная языковая модель (LLM), разработанная китайским стартапом Deepseek (Deep Search), недавно привлекла глобальное внимание. В интервью Nikkei Shin-Chi, авторитетной японской области исследований ИИ и профессором в Университете Токио, Мацуо, провели углубленный анализ технического уровня Deepseek, стратегии с открытым исходным кодом и ее влияния на японские компании.
Matsuo Toyo сказал, что технология Deepseek превосходна, и ее производительность близка к Chatgpt, разработанному Openai в Соединенных Штатах. Он отметил, что DeepSeek выпускает подробные технические документы каждый раз, когда он выпускает новую модель, показывая ее инновации в оптимизации модели. Например, последняя модель «R1», выпущенная в январе этого года, улучшила свои способности вывода благодаря обучению подкреплению, достигнув уровня, сравнимого с моделью Openai «O1».
Мацуо Тунг считает, что уровень развития искусственного интеллекта Китая уже сопоставим с уровнем Соединенных Штатов и даже превосходит Соединенные Штаты в некоторых аспектах. Он указал, что в Китае есть не только технологические гиганты, такие как Alibaba, Tencent и Baidu, но также у него есть большое количество выдающихся инженеров, чтобы сформировать активную экосистему ИИ. Неудивительно, что рост Deepseek в такой среде и может еще больше изменить властную ландшафт глобальной конкуренции по искусственному интеллекту.
Мацуо Фенг подчеркнул, что успех DeepSeek дал важное вдохновение для японских стартапов. Будучи не более широкой технологической компанией, DeepSeek достигла ведущей мировой точности с помощью твердой технологии. Это показывает, что даже в Японии, если компании сосредоточены на технологических инновациях, у них также есть возможность совершить прорывы в области ИИ.
DeepSeek принимает стратегию с открытым исходным кодом, которая похожа на таких компаний, как Meta и Alibaba. Matsuo Tsubasa отмечает, что модель с открытым исходным кодом обеспечивает прочную основу для глобальных разработчиков, что облегчает дополнительные улучшения обучения и производительности. Он считает, что появление DeepSeek усилило влияние мощности с открытым исходным кодом.
Что касается рисков безопасности моделей искусственного интеллекта, Мацуо Тойо сказал, что риски варьируются в зависимости от того, как они используются. Модель с открытым исходным кодом может работать локально, избегая риска утечки данных; Он подчеркнул, что будь то DeepSeek или OpenAI, пользователи должны поддерживать доверие к поставщику услуг, потому что использование данных и обучение данных трудно полностью исключить.
Рост DeepSeek не только демонстрирует быстрое развитие технологии искусственного интеллекта Китая, но и приносит новую конкурентную ландшафт и направление развития в глобальную индустрию искусственного интеллекта. В будущем стоит ожидать, может ли DeepSeek продолжать поддерживать инновации и еще больше повысить производительность и безопасность своих моделей.