L'éditeur de Downcodes a appris qu'aiOla a récemment publié un modèle de transcription audio d'IA open source, Whisper-NER, qui peut protéger les informations sensibles en temps réel pendant le processus de transcription afin de protéger la confidentialité des utilisateurs. Cette décision améliore non seulement la sécurité de la transcription audio, mais offre également de nouvelles possibilités d'application de la technologie de l'IA dans des domaines où les exigences en matière de confidentialité sont élevées, comme le droit et les soins médicaux. Whisper-NER est construit sur la base du modèle Whisper d'OpenAI et est entièrement open source, permettant aux utilisateurs de l'utiliser, de le modifier et de le déployer librement.
Récemment, aiOla a annoncé le lancement de Whisper-NER, un modèle de transcription audio IA open source qui peut masquer les informations sensibles en temps réel pendant le processus de transcription.
Le nouveau Whisper-NER d'aiOla est construit sur le modèle open source standard d'OpenAI, Whisper, lui-même entièrement open source, et désormais disponible sur Hugging Face et Github pour que les entreprises, les organisations et les particuliers puissent l'utiliser, l'adapter, le modifier et le déployer.
Le modèle de transcription audio dispose d'options de configuration flexibles et les utilisateurs peuvent choisir de masquer ou non les informations sensibles en fonction de leurs besoins. Lorsque l'utilisateur sélectionne la fonction de masquage, le modèle identifiera et masquera automatiquement les informations sensibles telles que les noms personnels, les adresses, les numéros de téléphone, etc., empêchant ainsi les fuites de confidentialité dans le texte transcrit. Cette capacité rend le modèle particulièrement important dans les scénarios d’application dans les domaines juridique, médical, éducatif et autres.
En plus de protéger les informations sensibles, le modèle dispose également de capacités de transcription efficaces et précises qui fonctionnent bien dans plusieurs langues et accents. Cela rend son application dans des environnements multilingues encore plus répandue. Par exemple, lorsque les entreprises traitent les commentaires des clients, elles peuvent enregistrer et analyser avec précision les informations audio provenant de différentes régions, améliorant ainsi la qualité du service.
De plus, aiOla encourage les développeurs et les chercheurs à utiliser ce modèle open source pour améliorer encore ses capacités. Les utilisateurs peuvent obtenir le code source sur la plateforme open source et le modifier et l'optimiser selon leurs propres besoins. Cette approche améliore non seulement la convivialité du modèle, mais favorise également l’innovation et le développement de la technologie de l’IA.
Ce nouveau produit d'aiOla démontre l'accent mis sur la protection de la vie privée dans le domaine de la transcription audio et ouvre également davantage de possibilités pour les futures applications d'IA. À mesure que de plus en plus d’utilisateurs et de développeurs nous rejoignent, nous espérons que ce modèle open source apportera des scénarios d’application et une influence plus larges.
Whisper-NER est entièrement open source et disponible sous licence MIT, permettant aux utilisateurs de l'adopter, de le modifier et de le déployer librement, y compris pour des applications commerciales. Les utilisateurs peuvent désormais également essayer le modèle de démonstration sur Hugging Face, qui leur permet d'enregistrer des clips vocaux et de demander au modèle de masquer les mots spécifiques qu'ils tapent dans le script de saisie généré.
visage câlin : https://huggingface.co/aiola/whisper-ner-v1
github : https://github.com/aiola-lab/whisper-ner
Dans l’ensemble, les fonctionnalités open source et de protection de la vie privée de Whisper-NER ont apporté de nouvelles avancées dans le domaine de la transcription audio par l’IA, et ses perspectives d’application méritent d’être attendues. L'éditeur de Downcodes recommande aux lecteurs intéressés de se rendre sur Hugging Face et Github pour en savoir plus.