Argmax ha lanzado WhisperKit, su primer proyecto de código abierto, diseñado para mejorar significativamente la eficiencia de la transcripción de voz en tiempo real en dispositivos Apple. Este movimiento proporciona a los desarrolladores paquetes Swift convenientes y aplicaciones de muestra, y ha demostrado excelentes mejoras de rendimiento en los modelos de iPhone 12 a 15. El proyecto adopta la licencia del MIT y planea agregar funciones como informes de rendimiento y predicción de procesamiento por lotes asíncrono en el futuro para mejorar aún más su practicidad y eficiencia.
Argmax anuncia WhisperKit, su primer proyecto de código abierto diseñado para mejorar el rendimiento de la transcripción de voz en tiempo real en dispositivos Apple. El proyecto utiliza una licencia del MIT para proporcionar a los desarrolladores paquetes Swift, aplicaciones de muestra de iOS y macOS, y logra importantes mejoras de rendimiento en los iPhone 12 a 15. Está previsto introducir funciones como informes de rendimiento y predicción por lotes asincrónica.
El lanzamiento de código abierto de WhisperKit reduce el umbral de aplicación de la tecnología de transcripción de voz, ayuda a más desarrolladores a integrar funciones eficientes de reconocimiento de voz en sus aplicaciones y promueve el desarrollo de aplicaciones de tecnología de voz en el ecosistema de Apple. Las funciones de procesamiento asincrónico y de informes de rendimiento en versiones futuras también mejorarán aún más la practicidad y eficiencia de WhisperKit.