Argmax telah merilis WhisperKit, proyek sumber terbuka pertamanya, yang dirancang untuk meningkatkan efisiensi transkripsi ucapan real-time secara signifikan di perangkat Apple. Langkah ini memberi pengembang paket Swift dan aplikasi sampel yang nyaman, dan telah menunjukkan peningkatan kinerja yang luar biasa pada model iPhone 12 hingga 15. Proyek ini mengadopsi lisensi MIT dan berencana untuk menambahkan fungsi seperti pelaporan kinerja dan prediksi pemrosesan batch asinkron di masa depan untuk lebih meningkatkan kepraktisan dan efisiensinya.
Argmax mengumumkan WhisperKit, proyek sumber terbuka pertamanya yang dirancang untuk meningkatkan kinerja transkripsi ucapan real-time di perangkat Apple. Proyek ini menggunakan lisensi MIT untuk menyediakan paket Swift, aplikasi sampel iOS dan macOS kepada pengembang, dan mencapai peningkatan kinerja yang signifikan pada iPhone 12 hingga 15. Direncanakan untuk memperkenalkan fungsi-fungsi seperti pelaporan kinerja dan prediksi batch asinkron.
Rilisan open source WhisperKit menurunkan ambang batas penerapan teknologi transkripsi ucapan, membantu lebih banyak pengembang mengintegrasikan fungsi pengenalan ucapan yang efisien ke dalam aplikasi mereka, dan mendorong pengembangan penerapan teknologi ucapan di ekosistem Apple. Pelaporan kinerja dan fungsi pemrosesan asinkron di versi mendatang juga akan semakin meningkatkan kepraktisan dan efisiensi WhisperKit.