Nvidia coopera con XAI para lanzar oficialmente el grupo de entrenamiento de IA más fuerte del mundo Coloso, que consta de 100,000 GPU de Nvidia Hopper y está previsto que se expanda a 200,000 en el futuro. Coloso se utiliza principalmente para capacitar a modelos de lenguaje a gran escala de XAI y proporciona servicios de chatbot para usuarios de Xpremium. Su velocidad de construcción eficiente es impresionante y completa en solo 122 días, lo que refleja los resultados de la tecnología avanzada y la colaboración eficiente del equipo. El potente rendimiento de Colossus es compatible con la plataforma de redes Ethernet Nvidia Spectrum-X, que proporciona un ancho de banda de hasta 400 Gbps, mejora significativamente las tasas de transmisión de datos y se centra en el desarrollo sostenible y reduce el consumo de energía en los centros de datos.
Hoy, Nvidia anunció que el clúster de supercomputador de Colossus creado en colaboración con Xai se ha lanzado oficialmente el clúster de entrenamiento de IA más poderoso del mundo, que consta de 100,000 GPU de Hopper Nvidia.
La razón por la cual este gigante ha alcanzado esta escala se debe al soporte de la plataforma de red Ethernet Nvidia Spectrum-X. Esta plataforma está diseñada específicamente para fábricas de IA múltiples enquiler y ultra largos a escala, y puede lograr un acceso remoto de memoria directa a través de Ethernet estándar, proporcionando un excelente rendimiento.
Colossus se utiliza principalmente para entrenar la serie Grok de modelos de idiomas grandes de Xai, y también proporciona servicios de chatbot para usuarios de X premium. Lo que es aún más emocionante es que Xai planea duplicar el tamaño de Coloso, que alcanzará 200,000 GPU de la tolva nvidia para entonces.
Gilad Shainer, vicepresidente senior de NVIDIA, dijo que la IA se ha convertido en un requisito clave para todas las industrias, por lo que los requisitos de rendimiento, seguridad, escalabilidad y rentabilidad también están aumentando. La aparición de la plataforma Spectrum-X proporciona a innovadores como XAI con capacidades de procesamiento de datos, análisis y ejecución más rápido, acelerando así el desarrollo, el implementación y el tiempo para comercializar las soluciones de IA.
Elon Musk también elogió esto, llamando a Coloso el sistema de entrenamiento más poderoso del mundo, elogiando los esfuerzos del equipo de XAI, Nvidia y sus numerosos socios. Vale la pena mencionar que el proceso de construcción de Coloso es bastante eficiente y tarda solo 122 días en completarse. Todo el proceso tardó solo 19 días desde la entrada del primer estante hasta el comienzo de la capacitación.
Con el soporte de esta supercomputadora, la plataforma Spectrum-X puede proporcionar un ancho de banda de hasta 400 Gbps, mejorando significativamente las tasas de transferencia de datos y reduciendo la latencia. Esta característica es crucial para las empresas que requieren un procesamiento rápido de datos y un análisis en tiempo real. Además, Spectrum-X también está optimizado para admitir aplicaciones de IA, lo que hace que el enrutamiento de datos y la gestión sea más inteligente, mejorando así el rendimiento general del sistema.
La arquitectura Coloso está diseñada para escalar eficientemente para hacer frente a la gran cantidad de datos generados por las aplicaciones modernas. Mientras tanto, Spectrum-X también se centra en el desarrollo sostenible, esforzándose por reducir el consumo de energía en los centros de datos al tiempo que mantiene el alto rendimiento y ayuda a las organizaciones a reducir su huella de carbono.
Puntos clave:
La supercomputadora Colossus consta de 100,000 GPU de Hopper Nvidia, está capacitando modelos de idiomas grandes y planea expandirse a 200,000 GPU.
La plataforma de red Spectrum-X proporciona un ancho de banda de hasta 400 Gbps, optimizando la transmisión de datos y las capacidades de análisis en tiempo real.
La plataforma se centra en la sostenibilidad y tiene como objetivo reducir el consumo de energía en los centros de datos al tiempo que mantiene un alto rendimiento.
El lanzamiento de Coloso marca un nuevo hito en la potencia informática de IA, y sus conceptos de diseño eficientes, escalables y sostenibles proporcionan nuevas direcciones para el desarrollo futuro de la IA. La colaboración entre Xai y Nvidia también ha inyectado un fuerte impulso en la innovación en el campo de la IA.