En los últimos años, la IA conversacional en tiempo real ha atraído mucha atención, pero el problema de la demora siempre ha sido un factor importante que restringe su desarrollo. El tiempo de espera a largo plazo afecta seriamente la experiencia del usuario y reduce la practicidad de la IA. Para resolver este problema, Standard Intelligence Lab ha lanzado un modelo de audio de parámetros de código abierto de 850 millones de parámetros llamado Hertz-Dev, que se espera que cambie por completo el panorama de la IA conversacional en tiempo real y brinde a los desarrolladores e investigadores herramientas más convenientes y eficientes.
En la ola de tecnología actual, la inteligencia artificial conversacional (AI) se ha convertido en una parte importante de nuestras vidas. Sin embargo, la interacción rápida, eficiente y en tiempo real sigue siendo un gran desafío. En particular, el problema de retraso se refiere a la diferencia de tiempo entre la entrada y la respuesta, lo que a menudo ralentiza la experiencia de los robots de servicio al cliente y los asistentes virtuales, lo que afecta la experiencia del usuario.
Para llenar este vacío, Standard Intelligence Lab lanzó recientemente Hertz-Dev, un modelo de audio de parámetros de código abierto de 850 millones diseñado para lograr un salto en la IA conversacional en tiempo real.
Lo más destacado de Hertz-Dev son sus excelentes métricas de rendimiento, con una latencia teórica de solo 80 milisegundos y 120 milisegundos en uso real, todo lo cual requiere solo una tarjeta gráfica NVIDIA RTX4090. Este modelo eficiente permite a los desarrolladores e investigadores experimentar tecnología de IA avanzada sin la necesidad de una enorme infraestructura, lo que realmente hace tecnologías complejas de modelado de audio al alcance.
Vale la pena mencionar que la arquitectura de Hertz-Dev adopta una variedad de nuevas tecnologías de optimización para garantizar que la calidad del resultado permanezca alta al tiempo que reduce la carga informática. Su eficiencia operativa permite a los desarrolladores independientes, nuevas empresas y grandes organizaciones lograr aplicaciones de alto rendimiento al tiempo que controlan los costos. El rendimiento de este modelo es revolucionaria, lo que hace que la interacción entre humanos y máquinas sea más natural, casi comparable a la comunicación entre humanos.
El procesamiento de audio en tiempo real tiene una amplia gama de prospectos de aplicaciones, incluida la automatización de atención al cliente, los socios de IA interactivos y las convenientes herramientas auxiliares para usuarios con necesidades especiales. Hertz-Dev mejora la interactividad de la IA controlando el retraso a menos de 120 milisegundos, lo que hace que la experiencia interactiva sea casi imperceptible. Las pruebas preliminares muestran que Hertz-DEV puede reducir el tiempo de respuesta hasta en un 40% en comparación con los modelos de código abierto anteriores. Esta flexibilidad lo hace adecuado para una variedad de escenarios, desde el control de voz en los hogares inteligentes hasta la automatización del servicio al cliente.
El lanzamiento de Standard Intelligence Lab de Hertz-Dev indudablemente aporta una nueva esperanza al futuro de la IA conversacional en tiempo real. No es solo un modelo de código abierto de alto parámetro y alto rendimiento, sino que también brinda a más desarrolladores e investigadores la oportunidad de explorar las infinitas posibilidades de diálogo con IA. Con el uso generalizado de Hertz-Dev, podemos esperar la llegada de una era más rápida, más conveniente y humanizada de inteligencia artificial.
Entrada del proyecto: https://github.com/standard-intelligence/hertz-dev
Detalles: https://si.inc/hertz-dev/
Puntos clave:
Hertz-Dev es un modelo de audio de parámetros de código abierto de 850 millones con un retraso teórico de solo 80 milisegundos y un retraso real de 120 milisegundos.
Este modelo permite a los desarrolladores e investigadores independientes usar fácilmente tecnología de IA conversacional avanzada en tiempo real sin la necesidad de un soporte de hardware masivo.
La aplicación generalizada de Hertz-Dev promoverá el desarrollo de la inteligencia artificial en muchos campos, como la atención al cliente y los hogares inteligentes, lo que hace que las interacciones con máquinas sean más naturales.
La aparición de Hertz-Dev marca un nuevo hito para la tecnología de IA conversacional conversacional en tiempo real. Su rendimiento eficiente y características de código abierto promoverán en gran medida la aplicación y el desarrollo de la tecnología de IA en todos los ámbitos de la vida, y contribuirán a la construcción de un futuro más inteligente y conveniente.