Etched AI, una nueva empresa estadounidense de chips, ha logrado recientemente un gran avance al grabar con éxito la arquitectura Transformer directamente en el chip y desarrollar el primer servidor del mundo construido específicamente para la inferencia de Transformer. El rendimiento de este servidor supera con creces el de productos similares de NVIDIA, puede ejecutar billones de modelos de parámetros y tiene muchas funciones como agente de voz en tiempo real, codificación eficiente y búsqueda de árbol, decodificación especulativa de multidifusión, etc. También está equipado con Memoria de gran ancho de banda HBM3E de 144 GB. Se espera que esta innovación cambie por completo las perspectivas de aplicación de la arquitectura Transformer y traiga cambios revolucionarios al campo de la inteligencia artificial.
El artículo se centra en:
La startup estadounidense de chips Etched AI grabó con éxito la arquitectura Transformer directamente en el chip, creando el servidor más potente del mundo dedicado a la inferencia de Transformer. Esta tecnología puede ejecutar modelos con billones de parámetros, cientos de kilómetros por delante de Nvidia. El servidor tiene múltiples funciones, que incluyen proxy de voz en tiempo real, mejores capacidades de codificación y búsqueda en árbol, capacidades de decodificación especulativa de multidifusión y está equipado con un HBM3E de 144 GB. Esta innovadora tecnología brindará nuevas posibilidades a la aplicación de la arquitectura Transformer.
Este avance de Etched AI marca un salto en el campo del hardware de inteligencia artificial. Su potente rendimiento y ricas funciones traerán mejoras significativas a muchos escenarios de aplicaciones y merecen la atención y las expectativas de la industria. En el futuro, es posible que veamos aplicaciones más innovadoras basadas en esta tecnología.