La velocidad de generación de modelos grandes se ha convertido en un cuello de botella y un equipo de ex empleados de Google desarrolló un nuevo chip LPU

Autor：Eve Cole Fecha de actualización：2025-02-03 03:32:01

Groq, fundada por ex empleados de Google, lanzó recientemente su chip de aceleración de IA LPU. Este chip mejora significativamente la velocidad de inferencia y generación de modelos grandes a través de la innovadora tecnología de almacenamiento SRAM y un diseño arquitectónico que reduce el acceso a la memoria. Se dice que la velocidad puede ser hasta diez veces mayor que la de la GPU. LPU admite una variedad de modelos grandes como Llama y Mixtral. Su lanzamiento ayudará a optimizar el rendimiento de los modelos grandes y mejorará la velocidad de respuesta de aplicaciones como asistentes de voz y escritura de IA, brindando nuevas posibilidades para mejorar el rendimiento de las aplicaciones de IA. Esto marca un avance importante en el campo de los chips de IA.

Groq es una startup de chips de IA fundada por ex empleados de Google. La compañía ha lanzado un chip de aceleración de IA llamado LPU, que acelera enormemente la inferencia y generación de modelos grandes a través de innovación tecnológica, con velocidades hasta 10 veces mayores que las de las GPU. Esto se debe principalmente al uso de tecnología de almacenamiento SRAM de alta velocidad y al diseño arquitectónico que reduce el acceso a la memoria. Los usuarios pueden ejecutar Llama, Mixtral y otros modelos grandes en LPU. La introducción de LPU puede ayudar a optimizar aún más el rendimiento de modelos grandes o utilizarse para mejorar la velocidad de respuesta de aplicaciones como asistentes de voz y escritura con IA.

La aparición de chips LPU ha aportado nueva vitalidad al campo de la IA. Se espera que su rendimiento de alta velocidad promueva la popularización y el desarrollo de más aplicaciones de IA. Vale la pena seguir prestando atención a su rendimiento e impacto en el mercado futuro. . Esperamos ver surgir más aplicaciones innovadoras basadas en LPU en el futuro.