El modelo de IA de próxima generación de xAI, Grok3, cuyo lanzamiento originalmente estaba previsto para finales de 2024, no salió según lo previsto, lo que generó preocupación en la industria. Grok3 se posiciona como un producto para competir con GPT-4 y Gemini, tiene capacidades de análisis de imágenes y respuesta a preguntas y se utiliza en la plataforma social X de Musk. Los retrasos en su proceso de desarrollo, así como los retrasos en proyectos similares de otras empresas de IA, han hecho pensar en los cuellos de botella de los métodos actuales de entrenamiento de IA.
Recientemente, el modelo de IA de próxima generación Grok3, que originalmente estaba previsto que fuera lanzado a finales de 2024 por xAI, una empresa de IA fundada por Elon Musk, no llegó según lo previsto. Esta noticia ha atraído una atención generalizada en la industria. Grok3 se considera el principal producto competitivo de xAI frente a GPT-4 de OpenAI y Gemini de Google. Tiene capacidades de análisis de imágenes y preguntas y respuestas, y se ha aplicado en la red social X de Musk.
El verano pasado, Musk dijo en la plataforma X que Grok3 sería "un gran avance previsto después de 100.000 entrenamientos con H100". Pero el 2 de enero, justo después del año nuevo, Grok3 todavía no salió y no había señales de que fuera a lanzarse pronto. Se informa que es posible que primero se lance una versión intermedia "Grok2.5".
Este fenómeno no es un caso aislado. Muchas empresas de la industria de la IA han experimentado situaciones embarazosas similares. Tomemos como ejemplo la startup de IA Anthropic, que el año pasado no lanzó el sucesor de su modelo Claude3Opus, Claude3.5Opus, como estaba previsto, e incluso decidió abandonar el lanzamiento del modelo después de anunciar que se lanzaría al final. de 2024. Además, Google y OpenAI también han experimentado retrasos en el lanzamiento de sus modelos estrella.
Detrás de esta serie de retrasos pueden reflejarse los obstáculos que enfrentan los métodos actuales de entrenamiento de IA. En el pasado, las empresas podían lograr mejoras significativas en el rendimiento mediante una potencia informática masiva y conjuntos de datos más grandes para la capacitación. Pero a medida que la mejora del rendimiento de cada generación de modelos se reduce gradualmente, las empresas comienzan a buscar tecnologías alternativas para superar el cuello de botella actual. En una entrevista con el presentador de podcast Lex Fridman, Musk dijo que aunque sus expectativas para Grok 3 son altas, también admitió que es posible que no se haga realidad.
Además, el pequeño tamaño del equipo xAI también puede ser una de las razones importantes del retraso de Grok3. Entre los competidores, xAI tiene recursos y mano de obra relativamente limitados, lo que sin duda les hace enfrentar más desafíos al desarrollar nuevos modelos.
En general, el retraso de Grok3 no es sólo un pequeño episodio de xAI, sino también una tendencia general que muestra toda la industria de la IA cuando se enfrenta a cuellos de botella técnicos.
El lanzamiento retrasado de Grok3 resalta los desafíos técnicos y las presiones comerciales que enfrentan la investigación y el desarrollo de modelos de lenguaje a gran escala. En el futuro, la industria de la IA necesitará explorar nuevos métodos y tecnologías de capacitación para abordar el cuello de botella de la mejora del rendimiento del modelo y mejorar la eficiencia de la investigación y el desarrollo.