Компания DeepSeek, занимающаяся искусственным интеллектом в Ханчжоу, выпустила свою новейшую крупномасштабную языковую модель V3, которая обеспечивает производительность, аналогичную GPT-4 от OpenAI и Claude 3.5Sonnet от Anthropic, при низкой цене (5,6 миллиона долларов), привлекая внимание отрасли. Это достижение подчеркивает сильные исследовательские и инженерные возможности DeepSeek в условиях ограниченных ресурсов, а также дает новые идеи для исследования и разработки крупномасштабных языковых моделей, бросая вызов традиционной концепции о том, что большие инвестиции могут привести к высокой отдаче. Успех модели V3 может указывать на дополнительные возможности для будущего развития в области искусственного интеллекта.
Недавно DeepSeek, компания, занимающаяся искусственным интеллектом, расположенная в Ханчжоу, выпустила свою последнюю крупномасштабную языковую модель V3. Производительность этой модели с открытым исходным кодом в многочисленных тестах производительности близка к производительности 4o от OpenAI и Claude3.5Sonnet от Anthropic, которые произвели впечатление на отрасль. По сравнению с сотнями миллионов долларов, вложенными американскими коллегами, общая стоимость модели DeepSeek V3 составляет всего 5,6 миллиона долларов США. Эта огромная разница бросается в глаза.
Лян Вэньфэн, генеральный директор DeepSeek, сказал, что финансирование никогда не было для них проблемой. Хотя V3 обучен на базе чипа H800, команда DeepSeek все же может продемонстрировать сильные исследовательские и инженерные возможности, несмотря на ограниченные ресурсы.
Андрей Карпати, пионер в области искусственного интеллекта, отметил, что инвестиционный бюджет DeepSeek был «какой шуткой», но конечным результатом стали «очень впечатляющие исследования и разработки в условиях ограниченности ресурсов».
AGI считается «Святым Граалем» исследований ИИ, способным превзойти людей в решении проблем и выполнении задач. Соответствующие эксперты предсказывают, что, как только технология станет зрелой, первая страна, внедрившая AGI, будет иметь огромные экономические, научные преимущества и преимущества в области безопасности.
Успех модели DeepSeek V3 не только доказывает, что революционный прогресс может быть достигнут при низких затратах, но, что более важно, он открывает новую перспективу и направление для глобальных исследований и разработок в области ИИ, а также открывает возможности для развивающихся стран догнать передовые страны. уровни в области искусственного интеллекта обрели надежду. В будущем, возможно, подобных «чудес» произойдет еще больше.