Argmax は、Apple デバイスでのリアルタイム音声文字起こしの効率を大幅に向上させるために設計された、同社初のオープンソース プロジェクトである WhisperKit をリリースしました。この動きにより、開発者に便利な Swift パッケージとサンプル アプリケーションが提供され、iPhone 12 ~ 15 モデルで優れたパフォーマンスの向上が実証されました。同プロジェクトはMITライセンスを採用しており、将来的にはパフォーマンスレポートや非同期バッチ処理の予測などの機能を追加し、実用性と効率性をさらに向上させる予定だ。
Argmax は、Apple デバイスでのリアルタイム音声文字起こしのパフォーマンスを向上させるために設計された初のオープンソース プロジェクトである WhisperKit を発表しました。このプロジェクトは、MIT ライセンスを使用して、開発者に Swift パッケージ、iOS および macOS のサンプル アプリケーションを提供し、iPhone 12 ~ 15 で大幅なパフォーマンスの向上を実現します。パフォーマンスレポートや非同期バッチ予測などの機能も導入する予定だ。
WhisperKit のオープンソース リリースは、音声転写テクノロジーのアプリケーションの敷居を下げ、より多くの開発者が効率的な音声認識機能をアプリケーションに統合できるようにし、Apple エコシステムにおける音声テクノロジーのアプリケーション開発を促進します。将来のバージョンのパフォーマンス レポート機能と非同期処理機能も、WhisperKit の実用性と効率性をさらに強化します。