Adaptador NaturalVoiceSAPI
查看中文文档请点击这里
Um mecanismo de conversão de texto em fala (TTS) SAPI 5 que pode utilizar as vozes naturais/neurais fornecidas pelo Azure AI Speech Service, incluindo:
- Vozes naturais instaláveis para Narrator no Windows 11
- Vozes naturais online do recurso Read Aloud do Microsoft Edge
- Vozes naturais online do Azure AI Speech Service, se você tiver uma chave de assinatura adequada
Qualquer programa que suporte vozes SAPI 5 pode usar essas vozes naturais por meio deste mecanismo TTS.
Consulte as páginas wiki para obter mais informações técnicas.
Requisitos do sistema
Plataforma mínima testada: Windows XP SP3 e Windows XP Professional x64 Edition SP2.
Plataforma mínima que suporta vozes locais do Narrador: Windows 7 RTM, x86 32/64 bits.
Plataforma mínima que suporta a instalação de vozes do Narrador via Microsoft Store: Windows 10, build 17763.
Como posso instalar as vozes naturais do Narrator no Windows 11?
Vá para Configurações do sistema > Acessibilidade > Narrador , role para baixo até Voz do Narrador e clique no botão Adicionar para Adicionar vozes naturais .
Se o seu sistema não for novo o suficiente para ter essa opção, consulte os métodos abaixo.
Estou usando o Windows XP/Vista/7/8/10. Posso usar as vozes naturais do Narrador do Windows 11?
Windows XP/Vista : Infelizmente, as vozes locais do Narrador não são suportadas nessas plataformas. Mas as vozes online, incluindo as vozes Edge e Azure, ainda funcionam.
Windows 10 (compilação 17763 ou superior) : você pode escolher e instalar vozes do Windows 11 Narrator usando estes links da Microsoft Store.
Windows 7/8/10 (antes da compilação 17763) ou se você não puder usar a Microsoft Store:
- Copie o link da Microsoft Store de uma voz do Narrador do Windows 11 daqui.
- Use store.rg-adguard.net para obter um link para baixar o arquivo MSIX da voz.
- Prepare uma pasta para armazenar as pastas de voz. Certifique-se de que seu caminho não contenha caracteres não ASCII.
- Descompacte o arquivo MSIX (como se fosse um arquivo ZIP) em sua subpasta. Você pode ter várias subpastas de voz na mesma pasta pai. Certifique-se de que o nome da subpasta não contenha caracteres não ASCII.
- Defina a pasta pai como “Caminho de voz local” no instalador.
- Não coloque outras coisas além de subpastas de voz dentro desta pasta pai, ou o carregamento de voz poderá falhar.
O Narrador do Windows 10 não oferece suporte direto a vozes naturais, mas oferece suporte a vozes SAPI 5. Assim, você pode fazer as vozes do Narrador do Windows 11 funcionarem no Windows 10 por meio deste mecanismo.
Funcionará em versões futuras do Windows?
Este mecanismo usa algumas chaves de criptografia extraídas de arquivos do sistema para usar as vozes, então é mais um hack do que uma solução adequada.
Por enquanto, a Microsoft ainda não permitiu que aplicativos de terceiros usassem as vozes do Narrator/Edge, e isso pode parar de funcionar a qualquer momento, por exemplo, após uma atualização do sistema.
Instalação
- Baixe o arquivo zip na seção Releases.
- Extraia os arquivos em uma pasta. Certifique-se de não mover, renomear ou excluir os arquivos após a instalação. Se você deseja mover/excluir os arquivos, você deve desinstalá-lo primeiro.
- Execute
Installer.exe
. - Ele informará se a versão de 32 bits e a versão de 64 bits foram instaladas, na seção "Status da instalação".
- A versão de 32 bits funciona com programas de 32 bits e a versão de 64 bits funciona com programas de 64 bits.
- Em sistemas de 64 bits, para que isso funcione com todos os programas (32 e 64 bits), você precisa instalar os dois.
- Em sistemas de 32 bits, a linha “64 bits” não será mostrada.
- Clique em Instalar/Desinstalar. É necessária permissão do administrador.
- Escolha que tipo de voz você deseja usar. Por padrão, as vozes locais do Narrador (se houver suporte) e as vozes online do Microsoft Edge Read Aloud estão habilitadas.
- As vozes online requerem acesso à Internet e podem ser mais lentas e menos estáveis. Se quiser usar apenas as vozes locais do Narrador, você pode desmarcar "Habilitar vozes online do Microsoft Edge" e "Habilitar vozes online do Azure".
- Como existem muitas vozes online, por padrão, apenas aquelas nos seus idiomas preferidos e em inglês (EUA) são incluídas, para evitar sobrecarregar a lista de seleção de vozes. Clique em "Alterar..." para alterar quais idiomas estão incluídos.
- As vozes do Azure exigem uma chave de assinatura (chave de API) e sua região. Clique em "Definir chave do Azure" para inserir sua chave. Você pode visitar o Portal do Azure, acessar seu recurso de serviço de fala e, em seguida, acessar Gerenciamento de Recursos > Chaves e Ponto de Extremidade para copiar e colar a chave e a região.
- Feche a janela do instalador para aplicar as alterações. Você pode abrir o instalador novamente quando quiser alterar alguma coisa, e alterar as configurações não requer reinstalação ou permissão do administrador.
Ou você pode usar regsvr32
para registrar os arquivos DLL manualmente.
Para usuários avançados, aqui está uma lista dos valores de registro configuráveis deste programa.
Teste
Você pode usar o TtsApplication.exe
nas pastas x86
e x64
para testar o mecanismo.
É uma versão modificada do TtsApplication em Windows-classic-samples, que adicionou tradução em chinês e informações mais detalhadas para eventos de fonema/visema.
Ou você pode ir para Painel de controle > Fala (Windows XP) ou Painel de controle > Reconhecimento de fala > Texto para fala (Windows Vista e posterior).
Bibliotecas usadas
- Microsoft.CognitiveServices.Speech.Extension.Embedded.TTS
- websocketpp
- ASIO (versão autônoma)
- OpenSSL
- nlohmann/json
- YY-Thunks (para compatibilidade com Windows XP)
- spdlog