Relatórios do editor de Downcodes: A empresa xAI de Musk anunciou recentemente que está implantando o cluster de treinamento de IA mais poderoso do mundo - o "Memphis Super Cluster" em Memphis, Tennessee. O cluster possui 100.000 GPUs Nvidia H100 com refrigeração líquida e usa tecnologia RDMA para otimizar a transmissão de dados, com o objetivo de criar o modelo de IA mais poderoso. Este movimento atraiu ampla atenção na indústria e destacou a concorrência acirrada no campo da IA. O objetivo do xAI é concluir o treinamento até dezembro de 2024, mas dado o progresso dos projetos anteriores de Musk, ainda há incerteza sobre se esse objetivo pode ser alcançado.
De acordo com notícias locais, o superaglomerado está equipado com 100.000 unidades de processamento gráfico (GPUs) Nvidia H100 com refrigeração líquida. Esses chips foram lançados desde o ano passado e a demanda do mercado é tão forte que até a concorrente OpenAI está utilizando esses dispositivos. Musk também mencionou que todo o cluster usa uma tecnologia chamada "Remote Direct Memory Access" (RDMA) durante a execução, que pode transmitir dados com eficiência entre nós de computação e reduzir a carga de trabalho da unidade central de processamento (CPU).
O objetivo da xAI é treinar “a IA mais poderosa em todos os indicadores” até dezembro de 2024 por meio deste supercluster. Em sua resposta, Musk enfatizou que o superaglomerado de Memphis proporcionaria “vantagens significativas” aos seus objetivos. No entanto, dados os atrasos anteriores de Musk em vários projetos, muitos estão receosos de concretizar esta promessa.
Na verdade, os concorrentes da xAI não estão ociosos. Empresas como OpenAI, Anthropic, Google, Microsoft e Meta estão correndo para introduzir modelos de linguagem grande (LLM) e modelos de linguagem pequena (SLM) mais poderosos e acessíveis. Portanto, a xAI precisa de novos modelos inovadores e práticos para ganhar uma posição nesta competição de inteligência artificial.
Além disso, pessoas familiarizadas com o assunto revelaram que a Microsoft está trabalhando com o CEO da OpenAI, Sam Altman, para desenvolver um supercomputador de treinamento de IA de US$ 100 bilhões com o codinome “Stargate”. Se este plano for adiante, o superaglomerado de Memphis da xAI pode não continuar sendo o mais poderoso do mundo.
Destaque:
xAI anunciou o lançamento do cluster de treinamento de IA mais poderoso do mundo, equipado com 100.000 GPUs Nvidia H100.
Musk planeja treinar a “IA mais poderosa” até dezembro de 2024 e disse que os clusters proporcionarão vantagens significativas.
A xAI enfrenta pressão de concorrentes como OpenAI e Google e precisa lançar modelos inovadores para se manter competitiva.
A conclusão do superaglomerado de Memphis marca uma nova etapa na competição pelo poder de computação da IA. Se o xAI pode atingir seus objetivos, o resultado final ainda precisa de tempo para ser testado. O beneficiário final desta corrida armamentista de IA será toda a humanidade. Vamos esperar para ver!