Успех DeepSeek V3 доказывает, что отечественный искусственный интеллект быстро развивается - статья AI

Автор：Eve Cole Время обновления：2025-01-28 04:48:01

Компания DeepSeek, занимающаяся искусственным интеллектом в Ханчжоу, выпустила свою новейшую крупномасштабную языковую модель V3, которая обеспечивает производительность, аналогичную GPT-4 от OpenAI и Claude 3.5Sonnet от Anthropic, при низкой цене (5,6 миллиона долларов), привлекая внимание отрасли. Это достижение подчеркивает сильные исследовательские и инженерные возможности DeepSeek в условиях ограниченных ресурсов, а также дает новые идеи для исследования и разработки крупномасштабных языковых моделей, бросая вызов традиционной концепции о том, что большие инвестиции могут привести к высокой отдаче. Успех модели V3 может указывать на дополнительные возможности для будущего развития в области искусственного интеллекта.

Недавно DeepSeek, компания, занимающаяся искусственным интеллектом, расположенная в Ханчжоу, выпустила свою последнюю крупномасштабную языковую модель V3. Производительность этой модели с открытым исходным кодом в многочисленных тестах производительности близка к производительности 4o от OpenAI и Claude3.5Sonnet от Anthropic, которые произвели впечатление на отрасль. По сравнению с сотнями миллионов долларов, вложенными американскими коллегами, общая стоимость модели DeepSeek V3 составляет всего 5,6 миллиона долларов США. Эта огромная разница бросается в глаза.

大模型元宇宙 (1)

Лян Вэньфэн, генеральный директор DeepSeek, сказал, что финансирование никогда не было для них проблемой. Хотя V3 обучен на базе чипа H800, команда DeepSeek все же может продемонстрировать сильные исследовательские и инженерные возможности, несмотря на ограниченные ресурсы.

Андрей Карпати, пионер в области искусственного интеллекта, отметил, что инвестиционный бюджет DeepSeek был «какой шуткой», но конечным результатом стали «очень впечатляющие исследования и разработки в условиях ограниченности ресурсов».

AGI считается «Святым Граалем» исследований ИИ, способным превзойти людей в решении проблем и выполнении задач. Соответствующие эксперты предсказывают, что, как только технология станет зрелой, первая страна, внедрившая AGI, будет иметь огромные экономические, научные преимущества и преимущества в области безопасности.

Успех модели DeepSeek V3 не только доказывает, что революционный прогресс может быть достигнут при низких затратах, но, что более важно, он открывает новую перспективу и направление для глобальных исследований и разработок в области ИИ, а также открывает возможности для развивающихся стран догнать передовые страны. уровни в области искусственного интеллекта обрели надежду. В будущем, возможно, подобных «чудес» произойдет еще больше.