DeepSeek объявила об официальном выпуске и открытом исходном коде своей большой языковой модели R1, производительность которой сопоставима с официальной версией OpenAI o1. R1 широко использует технологию обучения с подкреплением на этапе после обучения. Даже если объем аннотаций данных невелик, он может поддерживать сильные способности к рассуждению и хорошо работать в математике, кодировании и рассуждениях на естественном языке. DeepSeek также открыла исходный код двух моделей с размером параметра 660B, R1 и R1-Zero, а также 6 небольших моделей, использующих технологию дистилляции моделей, включая модели с параметрами 32B и 70B, производительность которых превзошла o1-mini OpenAI. Кроме того, DeepSeek также предоставляет высококонкурентный тарифный план API и принимает лицензию MIT, что позволяет неограниченное коммерческое использование и поощряет пользователей проводить вторичную разработку на основе R1.
DeepSeek R1 продемонстрировал свою сильную силу и открытость с точки зрения производительности, стратегии открытого исходного кода и цен на API, что знаменует собой значительный прогресс в отечественных технологиях искусственного интеллекта и предоставляет больше выбора и возможностей глобальным разработчикам искусственного интеллекта. Открытие R1 с открытым исходным кодом и связанных с ним ресурсов будет способствовать популяризации и развитию технологии искусственного интеллекта и ускорит наступление эры равных прав в технологиях искусственного интеллекта. Посетите ссылку для получения дополнительной информации: Документ: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf Документация по API: https://api-docs.deepseek.com/zh-cn /guides/reasoning_model