O editor do Downcodes descobriu que a aiOla lançou recentemente um modelo de transcrição de áudio de IA de código aberto, Whisper-NER, que pode proteger informações confidenciais em tempo real durante o processo de transcrição para proteger a privacidade do usuário. Esta medida não só melhora a segurança da transcrição de áudio, mas também oferece novas possibilidades para a aplicação da tecnologia de IA em áreas com elevados requisitos de privacidade, como direito e cuidados médicos. Whisper-NER é construído com base no modelo Whisper da OpenAI e é totalmente de código aberto, permitindo aos usuários usá-lo, modificá-lo e implementá-lo livremente.
Recentemente, a aiOla anunciou o lançamento do Whisper-NER, um modelo de transcrição de áudio de IA de código aberto que pode mascarar informações confidenciais em tempo real durante o processo de transcrição.
O novo Whisper-NER da aiOla é construído no modelo de código aberto padrão da indústria da OpenAI, Whisper, ele próprio totalmente de código aberto, e agora disponível no Hugging Face e no Github para empresas, organizações e indivíduos usarem, adaptarem, modificarem e implantarem.
O modelo de transcrição de áudio possui opções de configuração flexíveis e os usuários podem escolher se desejam mascarar informações confidenciais de acordo com suas necessidades. Quando o usuário seleciona a função de mascaramento, o modelo identificará e ocultará automaticamente informações confidenciais, como nomes pessoais, endereços, números de telefone, etc., evitando efetivamente o vazamento de privacidade no texto transcrito. Essa capacidade torna o modelo particularmente importante em cenários de aplicação nas áreas jurídica, médica, educacional e outras.
Além de proteger informações confidenciais, o modelo também possui recursos de transcrição eficientes e precisos que funcionam bem em vários idiomas e sotaques. Isso torna sua aplicação em ambientes multilíngues ainda mais difundida. Por exemplo, quando as empresas lidam com o feedback dos clientes, podem gravar e analisar com precisão informações de áudio de diferentes regiões, melhorando assim a qualidade do serviço.
Além disso, a aiOla incentiva desenvolvedores e pesquisadores a usarem esse modelo de código aberto para aprimorar ainda mais suas capacidades. Os usuários podem obter o código-fonte na plataforma de código aberto e modificá-lo e otimizá-lo de acordo com suas necessidades. Esta abordagem não só melhora a usabilidade do modelo, mas também promove a inovação e o desenvolvimento da tecnologia de IA.
Este novo produto da aiOla demonstra a sua ênfase na proteção da privacidade no campo da transcrição de áudio e também abre mais possibilidades para futuras aplicações de IA. À medida que mais usuários e desenvolvedores aderem, esperamos que esse modelo de código aberto traga cenários e influência de aplicativos mais amplos.
O Whisper-NER é totalmente de código aberto e está disponível sob a licença do MIT, permitindo que os usuários o adotem, modifiquem e implantem livremente, inclusive para aplicações comerciais. Os usuários agora também podem experimentar o modelo de demonstração no Hugging Face, que permite gravar clipes de fala e fazer com que o modelo mascare as palavras específicas digitadas no script de digitação gerado.
abraço: https://huggingface.co/aiola/whisper-ner-v1
github: https://github.com/aiola-lab/whisper-ner
Em suma, os recursos de código aberto e proteção de privacidade do Whisper-NER trouxeram novos avanços para o campo da transcrição de áudio de IA, e vale a pena esperar pelas perspectivas de sua aplicação. O editor do Downcodes recomenda aos leitores interessados que acessem Hugging Face e Github para saber mais.