NaturalVoiceSAPI어댑터
查看中文文档请点击这里
다음을 포함하여 Azure AI Speech Service에서 제공하는 자연/신경 음성을 활용할 수 있는 SAPI 5 TTS(텍스트 음성 변환) 엔진입니다.
- Windows 11에서 내레이터에 설치 가능한 자연스러운 음성
- Microsoft Edge의 소리내어 읽기 기능을 통한 온라인 자연스러운 음성
- 적절한 구독 키가 있는 경우 Azure AI Speech Service의 온라인 자연스러운 음성
SAPI 5 음성을 지원하는 모든 프로그램은 이 TTS 엔진을 통해 자연스러운 음성을 사용할 수 있습니다.
더 많은 기술 정보는 위키 페이지를 참조하세요.
시스템 요구 사항
최소 테스트 플랫폼: Windows XP SP3 및 Windows XP Professional x64 Edition SP2.
로컬 내레이터 음성을 지원하는 최소 플랫폼: Windows 7 RTM, x86 32/64비트.
Microsoft Store를 통해 내레이터 음성 설치를 지원하는 최소 플랫폼: Windows 10, 빌드 17763.
Windows 11에 내레이터 자연 음성을 어떻게 설치하나요?
시스템 설정 > 접근성 > 내레이터 로 이동하여 내레이터 음성 까지 아래로 스크롤한 다음 자연 음성 추가 에 대한 추가 버튼을 클릭합니다.
시스템이 이 옵션을 갖출 만큼 최신 버전이 아닌 경우 아래 방법을 참조하세요.
저는 Windows XP/Vista/7/8/10을 사용하고 있습니다. Windows 11에서 내레이터의 자연스러운 음성을 사용할 수 있나요?
Windows XP/Vista : 안타깝게도 해당 플랫폼에서는 로컬 내레이터 음성이 지원되지 않습니다. 그러나 Edge 및 Azure 음성을 포함한 온라인 음성은 여전히 작동합니다.
Windows 10(빌드 17763 이상) : 이러한 Microsoft Store 링크를 사용하여 Windows 11 내레이터 음성을 선택하고 설치할 수 있습니다.
Windows 7/8/10(빌드 17763 이전) 또는 Microsoft Store를 사용할 수 없는 경우:
- 여기에서 Windows 11 내레이터 음성의 Microsoft Store 링크를 복사하세요.
- store.rg-adguard.net을 사용하여 음성의 MSIX 파일을 다운로드할 수 있는 링크를 얻으세요.
- 음성 폴더를 저장할 폴더를 준비하세요. 경로에 ASCII가 아닌 문자가 포함되어 있지 않은지 확인하세요.
- MSIX 파일(ZIP 파일인 것처럼)을 해당 하위 폴더에 압축 해제합니다. 동일한 상위 폴더에 여러 개의 음성 하위 폴더를 가질 수 있습니다. 하위 폴더 이름에 ASCII가 아닌 문자가 포함되어 있지 않은지 확인하세요.
- 설치 프로그램에서 상위 폴더를 "로컬 음성 경로"로 설정합니다.
- 이 상위 폴더 안에 음성 하위 폴더 이외의 항목을 넣지 마십시오. 그렇지 않으면 음성 로딩이 실패할 수 있습니다.
Windows 10의 내레이터는 자연스러운 음성을 직접 지원하지 않지만 SAPI 5 음성은 지원합니다. 따라서 이 엔진을 통해 Windows 11 내레이터 음성이 Windows 10에서 작동하도록 할 수 있습니다.
향후 Windows 버전에서도 작동하나요?
이 엔진은 시스템 파일에서 추출한 일부 암호화 키를 사용하여 음성을 사용하므로 적절한 솔루션이라기보다는 해킹에 가깝습니다.
현재로서는 Microsoft는 아직 타사 앱이 내레이터/Edge 음성을 사용하는 것을 허용하지 않았으며 시스템 업데이트 후 등 언제든지 작동이 중지될 수 있습니다.
설치
- 릴리스 섹션에서 zip 파일을 다운로드합니다.
- 폴더의 파일을 추출합니다. 설치 후에는 파일을 이동하거나 이름을 바꾸거나 삭제하지 마십시오. 파일을 이동/삭제하려면 먼저 해당 파일을 제거해야 합니다.
-
Installer.exe
실행합니다. - "설치 상태" 섹션에서 32비트 버전과 64비트 버전이 설치되었는지 알려줍니다.
- 32비트 버전은 32비트 프로그램에서 작동하고, 64비트 버전은 64비트 프로그램에서 작동합니다.
- 64비트 시스템에서 모든 프로그램(32비트 및 64비트)에서 이 작업을 수행하려면 두 프로그램을 모두 설치해야 합니다.
- 32비트 시스템에서는 "64비트" 행이 표시되지 않습니다.
- 설치/제거를 클릭합니다. 관리자의 권한이 필요합니다.
- 어떤 종류의 음성을 사용하고 싶은지 선택하세요. 기본적으로 로컬 내레이터 음성(지원되는 경우) 및 Microsoft Edge Read Aloud 온라인 음성이 활성화됩니다.
- 온라인 음성을 사용하려면 인터넷 액세스가 필요하며 속도가 느리고 안정성이 떨어질 수 있습니다. 로컬 내레이터 음성만 사용하려면 "Microsoft Edge 온라인 음성 활성화" 및 "Azure 온라인 음성 활성화"를 선택 취소하면 됩니다.
- 온라인 음성이 많기 때문에 음성 선택 목록이 복잡해지지 않도록 기본적으로 선호하는 언어와 영어(미국)로 된 음성만 포함됩니다. 포함된 언어를 변경하려면 "변경..."을 클릭하세요.
- Azure Voice에는 구독 키(API 키)와 해당 지역이 필요합니다. "Azure 키 설정"을 클릭하여 키를 입력하세요. Azure Portal을 방문하고 음성 서비스 리소스로 이동한 다음 리소스 관리 > 키 및 엔드포인트 로 이동하여 키와 지역을 복사하여 붙여 넣을 수 있습니다.
- 변경 사항을 적용하려면 설치 프로그램 창을 닫으세요. 무언가를 변경하고 싶을 때 설치 프로그램을 다시 열 수 있으며, 설정을 변경하는 데에는 재설치나 관리자의 허가가 필요하지 않습니다.
또는 regsvr32
사용하여 DLL 파일을 수동으로 등록할 수 있습니다.
고급 사용자를 위한 이 프로그램의 구성 가능한 레지스트리 값 목록은 다음과 같습니다.
테스트
x86
및 x64
폴더의 TtsApplication.exe
사용하여 엔진을 테스트할 수 있습니다.
Windows-classic-samples의 TtsApplication 수정 버전으로, 중국어 번역과 음소/viseme 이벤트에 대한 자세한 정보가 추가되었습니다.
또는 제어판 > 음성(Windows XP) 또는 제어판 > 음성 인식 > 텍스트 음성 변환(Windows Vista 이상)으로 이동할 수 있습니다.
사용된 라이브러리
- Microsoft.CognitiveServices.Speech.Extension.Embedded.TTS
- 웹소켓pp
- ASIO(독립형 버전)
- OpenSSL
- nlohmann/json
- YY-Thunks(Windows XP 호환성용)
- spdlog