ByteDance и Пекинский университет создают MegaScale: единый «кластер Ванка» для обучения LLM
Bytedance и исследовательская группа из Пекинского университета опубликовали статью об arXiv, представив свою производственную систему MegaScale для обучения больших языковых моделей. Компания MegaScale создала единый кластер с более чем 10 000 графически
2025-02-07