El editor de Downcodes se enteró de que aiOla lanzó recientemente un modelo de transcripción de audio de IA de código abierto, Whisper-NER, que puede proteger información confidencial en tiempo real durante el proceso de transcripción para proteger la privacidad del usuario. Esta medida no solo mejora la seguridad de la transcripción de audio, sino que también brinda nuevas posibilidades para la aplicación de la tecnología de inteligencia artificial en campos con altos requisitos de privacidad, como el derecho y la atención médica. Whisper-NER está construido en base al modelo Whisper de OpenAI y es completamente de código abierto, lo que permite a los usuarios usarlo, modificarlo e implementarlo libremente.
Recientemente, aiOla anunció el lanzamiento de Whisper-NER, un modelo de transcripción de audio de IA de código abierto que puede enmascarar información confidencial en tiempo real durante el proceso de transcripción.
El nuevo Whisper-NER de aiOla se basa en el modelo Whisper de código abierto estándar de la industria de OpenAI, en sí mismo de código abierto, y ahora disponible en Hugging Face y Github para que empresas, organizaciones e individuos lo utilicen, adapten, modifiquen e implementen.
El modelo de transcripción de audio tiene opciones de configuración flexibles y los usuarios pueden elegir si desean enmascarar información confidencial según sus necesidades. Cuando el usuario selecciona la función de enmascaramiento, el modelo identificará y ocultará automáticamente información confidencial como nombres personales, direcciones, números de teléfono, etc., evitando efectivamente la filtración de privacidad en el texto transcrito. Esta capacidad hace que el modelo sea particularmente importante en escenarios de aplicación en campos legal, médico, educativo y otros.
Además de proteger la información confidencial, el modelo también tiene capacidades de transcripción eficientes y precisas que funcionan bien en múltiples idiomas y acentos. Esto hace que su aplicación en entornos multilenguaje esté aún más extendida. Por ejemplo, cuando las empresas tratan con los comentarios de los clientes, pueden grabar y analizar con precisión información de audio de diferentes regiones, mejorando así la calidad del servicio.
Además, aiOla anima a los desarrolladores e investigadores a utilizar este modelo de código abierto para mejorar aún más sus capacidades. Los usuarios pueden obtener el código fuente en la plataforma de código abierto y modificarlo y optimizarlo según sus propias necesidades. Este enfoque no sólo mejora la usabilidad del modelo, sino que también promueve la innovación y el desarrollo de la tecnología de IA.
Este nuevo producto de aiOla demuestra su énfasis en la protección de la privacidad en el campo de la transcripción de audio y también abre más posibilidades para futuras aplicaciones de IA. A medida que se unan más usuarios y desarrolladores, esperamos que este modelo de código abierto brinde influencia y escenarios de aplicación más amplios.
Whisper-NER es completamente de código abierto y está disponible bajo la licencia MIT, lo que permite a los usuarios adoptarlo, modificarlo e implementarlo libremente, incluso para aplicaciones comerciales. Los usuarios ahora también pueden probar el modelo de demostración en Hugging Face, que les permite grabar clips de voz y hacer que el modelo enmascare las palabras específicas que escriben en el script de escritura generado.
abrazando cara: https://huggingface.co/aiola/whisper-ner-v1
github: https://github.com/aiola-lab/whisper-ner
En definitiva, las funciones de código abierto y protección de la privacidad de Whisper-NER han aportado nuevos avances al campo de la transcripción de audio mediante IA, y vale la pena esperar con ansias sus perspectivas de aplicación. El editor de Downcodes recomienda a los lectores interesados que vayan a Hugging Face y Github para obtener más información.