Argmax는 Apple 장치에서 실시간 음성 녹음의 효율성을 크게 향상시키도록 설계된 최초의 오픈 소스 프로젝트인 WhisperKit을 출시했습니다. 이러한 움직임은 개발자에게 편리한 Swift 패키지와 샘플 애플리케이션을 제공하며 iPhone 12~15 모델에서 뛰어난 성능 향상을 보여주었습니다. 해당 프로젝트는 MIT 라이선스를 채택했으며 향후 성능 보고, 비동기식 배치 처리 예측 등의 기능을 추가해 실용성과 효율성을 더욱 높일 계획이다.
Argmax는 Apple 장치의 실시간 음성 전사 성능을 향상시키기 위해 설계된 최초의 오픈 소스 프로젝트인 WhisperKit을 발표했습니다. 이 프로젝트는 MIT 라이선스를 사용하여 개발자에게 Swift 패키지, iOS 및 macOS 샘플 애플리케이션을 제공하고 iPhone 12~15에서 상당한 성능 향상을 달성합니다. 성능 보고, 비동기식 배치 예측 등의 기능을 도입할 예정입니다.
WhisperKit의 오픈 소스 릴리스는 음성 전사 기술의 애플리케이션 임계값을 낮추고, 더 많은 개발자가 효율적인 음성 인식 기능을 애플리케이션에 통합하도록 돕고, Apple 생태계에서 음성 기술의 애플리케이션 개발을 촉진합니다. 향후 버전의 성능 보고 및 비동기 처리 기능도 WhisperKit의 실용성과 효율성을 더욱 향상시킬 것입니다.