Argmax hat WhisperKit veröffentlicht, sein erstes Open-Source-Projekt, das die Effizienz der Echtzeit-Sprachtranskription auf Apple-Geräten deutlich verbessern soll. Dieser Schritt stellt Entwicklern praktische Swift-Pakete und Beispielanwendungen zur Verfügung und hat zu hervorragenden Leistungsverbesserungen bei den iPhone 12- bis 15-Modellen geführt. Das Projekt übernimmt die MIT-Lizenz und plant, in Zukunft Funktionen wie Leistungsberichte und asynchrone Stapelverarbeitungsvorhersage hinzuzufügen, um seine Praktikabilität und Effizienz weiter zu verbessern.
Argmax kündigt WhisperKit an, sein erstes Open-Source-Projekt zur Verbesserung der Sprachtranskriptionsleistung in Echtzeit auf Apple-Geräten. Das Projekt stellt Entwicklern mithilfe einer MIT-Lizenz Swift-Pakete sowie iOS- und macOS-Beispielanwendungen zur Verfügung und erzielt deutliche Leistungsverbesserungen auf den iPhones 12 bis 15. Es ist geplant, Funktionen wie Leistungsberichte und asynchrone Batch-Vorhersage einzuführen.
Die Open-Source-Veröffentlichung von WhisperKit senkt die Anwendungsschwelle der Sprachtranskriptionstechnologie, hilft mehr Entwicklern, effiziente Spracherkennungsfunktionen in ihre Anwendungen zu integrieren, und fördert die Anwendungsentwicklung der Sprachtechnologie im Apple-Ökosystem. Leistungsberichte und asynchrone Verarbeitungsfunktionen in zukünftigen Versionen werden auch die Praktikabilität und Effizienz von WhisperKit weiter verbessern.