NaturalVoiceSAPIАдаптер
查看中文文档请点击这里
Механизм преобразования текста в речь (TTS) SAPI 5, который может использовать естественные/нейронные голоса, предоставляемые службой речи Azure AI, в том числе:
- Устанавливаемые естественные голоса для Экранного диктора в Windows 11
- Естественные онлайн-голоса благодаря функции чтения вслух Microsoft Edge
- Естественные онлайн-голоса из службы речи Azure AI, если у вас есть соответствующий ключ подписки.
Любая программа, поддерживающая голоса SAPI 5, может использовать эти естественные голоса с помощью этого механизма TTS.
Посетите вики-страницы для получения дополнительной технической информации.
Системные требования
Минимальная протестированная платформа: Windows XP SP3 и Windows XP Professional x64 Edition SP2.
Минимальная платформа, поддерживающая локальные голоса диктора: Windows 7 RTM, x86 32/64-разрядная версия.
Минимальная платформа, поддерживающая установку голосов диктора через Microsoft Store: Windows 10, сборка 17763.
Как установить естественные голоса Экранного диктора в Windows 11?
Откройте «Настройки системы» > «Специальные возможности» > «Экранный диктор» , прокрутите вниз до пункта «Голос диктора» , затем нажмите кнопку «Добавить» , чтобы добавить естественные голоса .
Если ваша система недостаточно новая, чтобы иметь эту опцию, см. методы ниже.
Я использую Windows XP/Vista/7/8/10. Могу ли я использовать естественные голоса Экранного диктора из Windows 11?
Windows XP/Vista : К сожалению, локальные голоса диктора не поддерживаются на этих платформах. Но онлайн-голоса, включая голоса Edge и Azure, по-прежнему работают.
Windows 10 (сборка 17763 или более поздняя версия) . Вы можете выбрать и установить голоса диктора Windows 11, используя эти ссылки в Microsoft Store.
Windows 7/8/10 (до сборки 17763) или если вы не можете использовать Microsoft Store:
- Скопируйте отсюда ссылку на голос диктора Windows 11 в Microsoft Store.
- Используйте store.rg-adguard.net, чтобы получить ссылку для загрузки MSIX-файла голоса.
- Подготовьте папку для хранения голосовых папок. Убедитесь, что его путь не содержит символов, отличных от ASCII.
- Разархивируйте файл MSIX (как если бы это был ZIP-файл) в его подпапку. В одной родительской папке может быть несколько подпапок Voice. Убедитесь, что имя подпапки не содержит символов, отличных от ASCII.
- В установщике установите родительскую папку как «Локальный голосовой путь».
- Не помещайте в эту родительскую папку ничего, кроме голосовых подпапок, иначе загрузка голоса может завершиться неудачно.
Экранный диктор в Windows 10 не поддерживает естественные голоса напрямую, но поддерживает голоса SAPI 5. Таким образом, с помощью этого движка вы можете заставить голоса экранного диктора Windows 11 работать в Windows 10.
Будет ли это работать в будущих версиях Windows?
Этот движок использует некоторые ключи шифрования, извлеченные из системных файлов, для использования голосов, поэтому это скорее хак, чем правильное решение.
На данный момент Microsoft еще не разрешила сторонним приложениям использовать голоса Экранного диктора/Edge, и это может перестать работать в любой момент, например, после обновления системы.
Установка
- Загрузите zip-файл из раздела «Релизы».
- Извлеките файлы в папку. Обязательно не перемещайте, не переименовывайте и не удаляйте файлы после установки. Если вы хотите переместить/удалить файлы, сначала следует удалить их.
- Запустите
Installer.exe
. - В разделе «Состояние установки» вам будет сообщено, установлены ли 32-битная и 64-битная версии.
- 32-битная версия работает с 32-битными программами, а 64-битная версия работает с 64-битными программами.
- В 64-битных системах, чтобы это работало с каждой программой (32-битной и 64-битной), вам необходимо установить их обе.
- В 32-битных системах строка «64-бит» отображаться не будет.
- Нажмите «Установить/Удалить». Требуется разрешение администратора.
- Выберите, какие голоса вы хотите использовать. По умолчанию включены локальные голоса экранного диктора (если поддерживаются) и онлайн-голоса чтения вслух Microsoft Edge.
- Для онлайн-голосов требуется доступ к Интернету, и они могут работать медленнее и менее стабильно. Если вы хотите использовать только локальные голоса диктора, снимите флажки «Включить онлайн-голоса Microsoft Edge» и «Включить онлайн-голоса Azure».
- Поскольку в сети много голосов, по умолчанию включены только голоса на предпочитаемых вами языках и на английском (США), чтобы не загромождать список выбора голосов. Нажмите «Изменить...», чтобы изменить включенные языки.
- Для голоса Azure требуется ключ подписки (ключ API) и его регион. Нажмите «Установить ключ Azure», чтобы ввести свой ключ. Вы можете посетить портал Azure, перейти к ресурсу службы речи, затем перейти в раздел «Управление ресурсами» > «Ключи и конечная точка» , чтобы скопировать и вставить ключ и регион.
- Закройте окно установщика, чтобы применить изменения. Вы можете открыть Установщик снова, когда захотите что-то изменить, причем изменение настроек не требует переустановки или разрешения администратора.
Или вы можете использовать regsvr32
для регистрации файлов DLL вручную.
Для опытных пользователей вот список настраиваемых значений реестра этой программы.
Тестирование
Вы можете использовать TtsApplication.exe
в папках x86
и x64
для тестирования движка.
Это модифицированная версия TtsApplication в Windows-classic-samples, в которую добавлен китайский перевод и более подробная информация о событиях фонемы/виземы.
Или вы можете перейти в «Панель управления» > «Речь» (Windows XP) или «Панель управления» > «Распознавание речи» > «Преобразование текста в речь» (Windows Vista и более поздние версии).
Используемые библиотеки
- Microsoft.CognitiveServices.Speech.Extension.Embedded.TTS
- вебсокетпп
- ASIO (автономная версия)
- OpenSSL
- Нломанн/JSON
- YY-Thunks (для совместимости с Windows XP)
- Спдлог