Der Byte Wanka-Cluster hat das MegaScale-System erfolgreich aufgebaut und das GPT-3-Training effizient abgeschlossen
ByteDance und die Universität Peking haben erfolgreich einen Wanka-Cluster aufgebaut, das MegaScale-System eingeführt und das Training eines groß angelegten GPT-3-Modells in 1,75 Tagen abgeschlossen. Das System erreichte eine Rechenleistungsauslastung von
2025-02-08