Argmax lançou o WhisperKit, seu primeiro projeto de código aberto, projetado para melhorar significativamente a eficiência da transcrição de fala em tempo real em dispositivos Apple. Essa mudança fornece aos desenvolvedores pacotes Swift convenientes e aplicativos de amostra e demonstrou excelentes melhorias de desempenho nos modelos do iPhone 12 a 15. O projeto adota a licença do MIT e planeja adicionar funções como relatórios de desempenho e previsão de processamento em lote assíncrono no futuro para melhorar ainda mais sua praticidade e eficiência.
Argmax anuncia WhisperKit, seu primeiro projeto de código aberto projetado para melhorar o desempenho da transcrição de fala em tempo real em dispositivos Apple. O projeto usa uma licença do MIT para fornecer aos desenvolvedores pacotes Swift, aplicativos de amostra para iOS e macOS e obtém melhorias significativas de desempenho em iPhones 12 a 15. Está prevista a introdução de funções como relatórios de desempenho e previsão de lote assíncrona.
O lançamento de código aberto do WhisperKit reduz o limite de aplicação da tecnologia de transcrição de fala, ajuda mais desenvolvedores a integrar funções eficientes de reconhecimento de fala em seus aplicativos e promove o desenvolvimento de aplicativos de tecnologia de fala no ecossistema Apple. Relatórios de desempenho e funções de processamento assíncrono em versões futuras também aumentarão ainda mais a praticidade e a eficiência do WhisperKit.