Редактор Downcodes узнал, что aiOla недавно выпустила модель транскрипции аудио AI с открытым исходным кодом, Whisper-NER, которая может защищать конфиденциальную информацию в режиме реального времени во время процесса транскрипции для защиты конфиденциальности пользователей. Этот шаг не только повышает безопасность транскрипции аудио, но и открывает новые возможности для применения технологии искусственного интеллекта в областях с высокими требованиями к конфиденциальности, таких как юриспруденция и медицина. Whisper-NER построен на основе модели OpenAI Whisper и имеет полностью открытый исходный код, что позволяет пользователям свободно использовать, изменять и развертывать его.
Недавно aiOla объявила о запуске Whisper-NER, модели транскрипции аудио с открытым исходным кодом, которая может маскировать конфиденциальную информацию в режиме реального времени во время процесса транскрипции.
Новый Whisper-NER от aiOla построен на стандартной модели OpenAI с открытым исходным кодом Whisper, которая сама по себе полностью открыта и теперь доступна на Hugging Face и Github для использования, адаптации, модификации и развертывания предприятиями, организациями и частными лицами.
Модель транскрипции аудио имеет гибкие параметры конфигурации, и пользователи могут выбирать, маскировать ли конфиденциальную информацию в соответствии со своими потребностями. Когда пользователь выбирает функцию маскировки, модель автоматически идентифицирует и скрывает конфиденциальную информацию, такую как личные имена, адреса, номера телефонов и т. д., эффективно предотвращая утечку конфиденциальной информации в расшифрованном тексте. Эта способность делает модель особенно важной в сценариях применения в юридической, медицинской, образовательной и других областях.
Помимо защиты конфиденциальной информации, модель также обладает эффективными и точными возможностями транскрипции, которые хорошо работают на нескольких языках и с разными акцентами. Это делает его применение в многоязычной среде еще более распространенным. Например, когда компании занимаются обратной связью с клиентами, они могут точно записывать и анализировать аудиоинформацию из разных регионов, тем самым улучшая качество обслуживания.
Кроме того, aiOla призывает разработчиков и исследователей использовать эту модель с открытым исходным кодом для дальнейшего расширения ее возможностей. Пользователи могут получить исходный код на платформе с открытым исходным кодом, а также модифицировать и оптимизировать его в соответствии со своими потребностями. Такой подход не только повышает удобство использования модели, но также способствует инновациям и развитию технологий искусственного интеллекта.
Этот новый продукт от aiOla демонстрирует акцент на защите конфиденциальности в области транскрипции аудио, а также открывает больше возможностей для будущих приложений искусственного интеллекта. Мы ожидаем, что по мере того, как к нам присоединяется все больше пользователей и разработчиков, эта модель с открытым исходным кодом приведет к расширению сценариев применения и расширению влияния.
Whisper-NER имеет полностью открытый исходный код и доступен по лицензии MIT, что позволяет пользователям свободно принимать, модифицировать и развертывать его, в том числе для коммерческих приложений. Теперь пользователи также могут опробовать демонстрационную модель Hugging Face, которая позволяет им записывать речевые фрагменты и маскировать конкретные слова, которые они набирают, в сгенерированном наборе текста.
обнимающее лицо: https://huggingface.co/aiola/whisper-ner-v1
github: https://github.com/aiola-lab/whisper-ner
В целом, функции открытого исходного кода и защиты конфиденциальности Whisper-NER принесли новый прорыв в области транскрипции аудио с помощью искусственного интеллекта, и перспективы его применения заслуживают ожидания. Редактор Downcodes рекомендует заинтересованным читателям посетить Hugging Face и Github, чтобы узнать больше.