web speech recommended voices 다운로드 - web speech recommended voices 소스코드 다운로드

web speech recommended voices

기타 소스코드

다운로드

Web Speech API에 권장되는 음성

이 저장소는 읽기 앱에서 소리내어 읽기 기능을 구현하기 위한 모범 사례를 식별하기 위한 대규모 프로젝트의 일부입니다.

다양한 브라우저와 OS에서 기본적으로 수백 개의 음성을 사용할 수 있으므로 개발자가 합리적인 기본값과 선별된 음성 목록을 제공하는 것은 까다로울 수 있습니다.

음성 선택에 초점을 맞춘 이 프로젝트의 목표는 다양한 플랫폼에서 사용할 수 있는 고품질 음성을 문서화하고 JSON 구성 파일을 사용하여 이러한 권장 사항을 쉽게 구현할 수 있는 방법을 제공하는 것입니다.

사용 사례

언어별 최적의 기본 음성 제공
품질에 따라 순서가 지정된 음성 목록 표시
사용자에게 친숙한 음성 이름 표시
성별, 연령별(성인 vs. 아동) 추천 음성 필터링
참신하고 품질이 낮은 음성 필터링
테스트 발화로 음성 미리보기

데모

Readium Speech 프로젝트를 기반으로 한 라이브 데모를 사용할 수 있습니다.

이 데모는 이 저장소의 데이터와 함께 음성 선택에 대한 모범 사례를 모두 구현합니다.

지원되는 언어 목록

이 프로젝트의 목표는 Windows 및 macOS에서 사용 가능한 43개 언어를 모두 지원하는 것입니다.

현재 상태에서는 43개 언어를 다루고 있습니다.

아랍어(알제리, 바레인, 이집트, 이라크, 요르단, 쿠웨이트, 레바논, 리비아, 모로코, 오만, 카타르, 사우디아라비아, 시리아, 튀니지, 아랍에미리트, 예멘)
바스크 사람
벵골어(인도 및 방글라데시)
보지푸리
불가리아 사람
카탈로니아 사람
중국인:
- 표준 중국어(중국 본토, 대만)
- 우 중국어(일명 "상하이어")
- 월 중국어(일명 "광둥어")
크로아티아어
체코 사람
덴마크 말
네덜란드어(네덜란드 및 벨기에)
영어(미국, 영국, 호주, 캐나다, 홍콩, 인도, 아일랜드, 케냐, 뉴질랜드, 나이지리아, 스코틀랜드, 싱가포르, 남아프리카 및 탄자니아)
핀란드어
프랑스어(프랑스, 캐나다, 벨기에, 스위스)
갈리시아어
독일어(독일, 오스트리아, 스위스)
그리스 사람
헤브라이 사람
힌디 어
헝가리 인
인도네시아 인
이탈리아 사람
일본어
칸나다어
한국인
말레이 사람
마라티어
노르웨이 인
페르시아 인
광택
포르투갈어(포르투갈 및 브라질)
루마니아 사람
러시아인
슬로바키아 사람
슬로베니아
스페인어(스페인, 아르헨티나, 볼리비아, 칠레, 콜롬비아, 코스타리카, 쿠바, 도미니카 공화국, 에콰도르, 엘살바도르, 적도 기니, 과테말라, 온두라스, 멕시코, 니카라과, 파나마, 파라과이, 페루, 푸에르토리코, 미국, 우루과이 및 베네수엘라)
스웨덴어
타밀어(인도, 스리랑카, 말레이시아, 싱가포르)
텔루구어
태국어
터키어
우크라이나 말
베트남 사람

필터링할 음성 목록

스펙트럼의 반대쪽 끝에서 이 프로젝트는 음성 선택기 구성 요소에서 필터링해야 하는 여러 음성도 식별합니다.

그 중 일부는 전반적인 독서 경험에 해로운 반면, 일부는 더 나은 사전 로드 옵션을 사용할 수 있는 플랫폼에서 품질이 매우 낮습니다.

참신한 목소리(Apple 기기)
음성 품질이 매우 낮음(Apple 기기 및 Chrome OS)

기본 원칙

각 음성 목록은 순서가 지정되어 있으며 이 프로젝트에서 다루는 모든 브라우저/OS/언어에서 최적의 청취 경험을 제공하기 위한 것입니다.
그러나 각 목록에는 항상 신뢰할 수 있는 것이 있는지 확인하기 위한 기본 옵션도 포함되어 있습니다.
이 두 가지 목표를 염두에 두고 고품질 음성은 목록 상단에 나열되고, 품질이 낮거나 특수한 음성은 하단에 나열됩니다.
음성 수는 너무 많아 보일 수 있지만(영어로만 110개 이상의 음성) 실제로는 각 기기에서 사용자가 사용할 수 있는 음성의 수가 매우 적습니다.
Web Speech API에서 반환된 음성 이름은 사용자에게 친숙하지 않습니다. 이는 이 목록이 일반적으로 음성과 관련된 지역과 함께 이름(또는 성별)을 포함하는 대체 이름을 제공하는 이유입니다.
가능할 때마다 저는 항상 남녀 모두를 위한 고품질 옵션과 기본 옵션을 적절히 혼합하여 포함하려고 노력할 것입니다.
하지만 이 목록은 어떻게든 우선순위를 두어야 합니다. 현재 여성 목소리가 남성 목소리보다 위에 나열되어 있습니다. 각 음성과 관련된 성별이 문서화되어 있으므로 이를 통해 구현자는 이 기준에 따라 목록의 우선순위를 다시 지정/필터링할 수 있습니다.
지역 변형도 의도적으로 자체 파일로 분리되지 않고 단일 목록으로 그룹화됩니다. 일부 장치에서는 2~3개의 음성만 사용할 수 있으며 지역 변형을 분리하는 것은 의미가 없습니다.
그러나 지역적 변형은 목록에서 어떻게든 우선순위를 정해야 합니다. 현재로서는 최고의 음성 선택이 가능한 지역이 위에 나열되어 있지만 구현자는 사용자의 지역 선호도를 고려하는 것이 좋습니다.

통사론

JSON 스키마는 새로운 언어 또는 음성 추가에 대한 PR 공개에 관심이 있는 검증 또는 잠재적인 기여자를 위해 제공됩니다.

상표

추천 음성마다 label 필요하며, 음성별로 인간 친화적인 라벨을 제공합니다.

이 문자열은 대상 언어로 현지화되었으며 일반적으로 다음 정보를 포함합니다.

이름(가능한 경우)
성별(이름이 누락된 경우)
국가/지역

예 1: Microsoft Natural 음성

자연스러운 목소리를 위해 Microsoft에서 문서화한 이름은 쉽게 이해할 수 있지만 매우 긴 경향이 있으며 모두 영어로 현지화되어 있습니다.

{
  "label" : " Isabella (Italia) " ,
  "name" : " Microsoft Isabella Online (Natural) - Italian (Italy) " ,    
  "language" : " it-IT "
}

예 2: Chrome OS 음성

Chrome OS는 Android 하위 시스템을 통해 다양한 고품질 음성을 제공하지만 최종 사용자에게는 최악의 이름이 제공됩니다.

{
  "label" : " Female voice 1 (US) " ,
  "name" : " Android Speech Recognition and Synthesis from Google en-us-x-tpc-network " ,
  "language" : " en-US "
}

이름

각 추천 음성에는 name 이 필요하며 이 프로젝트에서 음성의 기본 식별자로 사용됩니다.

이름은 대부분 브라우저에서 안정적입니다. 즉, 대부분의 음성에는 단일 문자열이면 충분합니다.

하지만 불행하게도 Android, iOS, iPadOS 및 macOS 음성과 같은 몇 가지 특이점이 있습니다.

이러한 음성의 경우 문자열의 일부 이상이 지역화되는 경우가 많으며 이름 지정은 브라우저마다 일관되지 않을 수 있으며 설치된 변형 수에 따라 변경될 수 있습니다.

이로 인해 각 목록에는 다음 속성도 포함될 수 있습니다.

주어진 음성에 대한 대체 문자열 배열이 있는 altNames
및 이러한 음성을 현지화하는 데 사용되는 문자열 패턴을 식별하는 localizedName

예 3: Apple에 사전 로드된 음성의 대체 버전

{
  "label" : " Samantha (US) " ,
  "name" : " Samantha " ,
  "localizedName" : " apple " ,
  "altNames" : [
    " Samantha (Enhanced) " ,
    " Samantha (English (United States)) "
  ],
  "language" : " en-US "
}

언어

각 추천 음성에는 language 필요합니다.

여기에는 소문자로 된 두 글자 언어 코드 뒤에 대문자로 된 두 글자 국가 코드가 오는 BCP 47 언어 태그가 포함되어 있습니다.

언어와 국가 코드는 하이픈(-)을 사용하여 구분됩니다.

일부 음성은 다른 언어도 처리할 수 있습니다. 예를 들어 미국의 스페인어 음성은 영어도 처리할 수 있습니다.

이러한 이유로 현재는 거의 사용되지 않지만 additionalLanguages 속성도 사용할 수 있습니다.

여기에는 하위 태그 없이 두 글자 코드만 사용하는 언어 목록이 포함되어 있습니다.

Microsoft의 일부 새로운 음성은 다국어 출력도 가능합니다. 언어 전환은 문장 중간에 지원되지 않지만 출력은 각 문장의 언어를 자동 감지하여 그에 따라 채택할 수 있는 것으로 보입니다.

이를 지원하기 위해 프로세스에서 출력이 자동으로 다른 음성으로 전환될 수 있습니다.

이러한 음성은 multiLingual 부울을 사용하여 식별됩니다.

예 4: 다국어 출력이 가능한 음성

{
  "label" : " Emma (US) " ,
  "name" : " Microsoft EmmaMultilingual Online (Natural) - English (United States) " ,
  "language" : " en-US " ,
  "multiLingual" : true
}

예시 5: 제2언어를 처리할 수 있는 음성

{
  "label" : " Sylvie (Canada) " ,
  "name" : " Microsoft Sylvie Online (Natural) - French (Canada) " ,
  "language" : " fr-CA " ,
  "otherLanguages" : [
    " en "
  ]
}

성별과 어린이의 목소리

gender 은 각 음성에 대한 선택적 속성으로, 각 음성과 관련된 성별을 문서화합니다.

지원되는 값은 female , male 또는 neutral .

children 역시 선택 사항이며 부울을 사용하여 어린이 음성을 식별합니다.

예시 6: 여자 아이들의 목소리

{
  "label" : " Ana (US) " ,
  "name" : " Microsoft Ana Online (Natural) - English (United States) " ,
  "language" : " en-US " ,
  "gender" : " female " ,
  "children" : true
}

품질

quality 은 다양한 음성 변형의 품질을 문서화하는 각 음성의 선택적 속성입니다.

다음 값이 지원됩니다.

매우높음: 인간이 거의 구별할 수 없을 정도로 매우 높은 음성 합성 품질
높은: 인간과 같은 높은 품질의 음성 합성
정상: 음성 합성의 정상적인 품질
낮은: 인간과 같지 않은 음성 합성 품질이 낮음
매우낮음: 매우 낮지만 여전히 이해하기 쉬운 음성 합성 품질

예 7: 세 가지 품질 변형으로 제공되는 Apple 음성

{
  "label" : " Ava (US) " ,
  "name" : " Ava " ,
  "note" : " This voice can be installed on all Apple devices and offers three variants. Like all voices that can be installed on Apple devices, it suffers from inconsistent naming due to localization. " ,
  "altNames" : [
    " Ava (Premium) " ,
    " Ava (Enhanced) " ,
    " Ava (English (United States)) " ,
  ],
  "language" : " en-US " ,
  "gender" : " female " ,
  "quality" : [
    " low " ,
    " normal " ,
    " high "
  ],
  "rate" : 1 ,
  "pitch" : 1 ,
  "os" : [
    " macOS " ,
    " iOS " ,
    " iPadOS "
  ]
}

OS 및 브라우저

os 와 browser 모두 선택적 속성입니다. 이는 음성을 사용할 수 있는 운영 체제와 브라우저를 나타내는 데 사용됩니다.

이 두 속성은 조합으로 해석되지 않고 별도로 해석되어야 합니다.

예 8: Edge와 Windows 모두에서 사용할 수 있는 Microsoft 음성

{
  "label" : " Denise (France) " ,
  "name" : " Microsoft Denise Online (Natural) - French (France) " ,
  "note" : " This voice is preloaded in Edge on desktop. In other browsers, it requires the user to run Windows 11 and install the voice pack. " ,
  "language" : " fr-FR " ,
  "gender" : " female " ,
  "os" : [
    " Windows "
  ],
  "browser" : [
    " Edge "
  ]
}

또한, preloaded 식별된 모든 OS 및 브라우저에 음성이 사전 로드되어 있는지 여부를 나타냅니다.

현재 접근 방식에서는 Chrome 및 Windows에서 음성을 사용할 수 있음을 나타낼 수 없지만 예를 들어 Windows에서는 다운로드가 필요합니다.

예 9: Chrome 데스크톱에 사전 로드된 Google 음성

{
  "label" : " Google female voice (UK) " ,
  "name" : " Google UK English Female " ,
  "language" : " en-GB " ,
  "gender" : " female " ,
  "browser" : [
    " ChromeDesktop "
  ],
  "preloaded" : true
}

말하는 속도와 음조

Web Speech API를 사용할 때 SpeechSynthesisUtterance 다음에 대한 선택적 값을 지원합니다.

rate 조절하여 말하는 속도를 조절합니다.
피치를 제어하는 pitch

이 저장소에 문서화된 각 음성은 다음과 같은 선택적 속성을 지원합니다.

pitchControl 은 기본값이 true 이고 음성의 피치를 제어할 수 있는지 여부를 나타내는 부울입니다.
rate 0.1에서 10 사이의 정수이며 기본값은 1이고 각 음성에 권장되는 기본 음성 속도를 제공합니다.
pitch 0에서 2 사이의 정수이며 기본값은 1이며 각 음성에 권장되는 기본 피치를 제공합니다.

예 10: 피치를 조정할 수 없는 Microsoft 음성

{
  "label" : " Ana (US) " ,
  "name" : " Microsoft Ana Online (Natural) - English (United States) " ,
  "language" : " en-US " ,
  "gender" : " female " ,
  "pitchControl" : false
}

예 11: 권장 피치 및 속도 비율이 포함된 Google Voice

{
  "label" : " Voix Google féminine (France) " ,
  "name" : " Google français " ,
  "language" : " fr-FR " ,
  "gender" : " female " ,
  "rate" : 1 ,
  "pitch" : 0.8
}

추가 참고 사항

추천 음성 목록을 문서화하는 작업을 통해 다양한 브라우저/OS를 테스트하여 어떻게 작동하는지 확인하게 되었습니다. 이 섹션은 이러한 정보 중 일부를 요약하기 위한 것입니다.

Apple, Google, Microsoft 또는 Mozilla에 보고된 외부 문제를 추적하기 위한 전용 레이블도 사용할 수 있습니다.

일반적인

Web Speech API는 getVoices() 메서드를 통해 name , voiceURI , lang , localService 및 default 필드를 반환합니다.
voiceURI 이론적으로 음성을 식별하는 가장 일관된 방법이어야 하지만 실제로는 이는 진실과 더 이상 다를 수 없습니다. 대부분의 브라우저는 voiceURI 에 name 과 동일한 값을 사용하며 고유성을 적용하지 않습니다.
특정 브라우저/OS에 대한 참고 사항에서 볼 수 있듯이 name 도 일관되지 않게 구현되며 동일한 장치에서 동일한 음성에 대해 다른 값을 반환할 수 있습니다.
localService 음성을 오프라인으로 사용할 수 있는지, 음성이 예상대로 작동하는지 여부를 나타냅니다. 따라서 현재 권장 음성 목록에는 해당 정보가 포함되어 있지 않습니다.
lang 기본 언어가 소문자이고 하위 태그가 대문자( pt-BR )인 BCP 47 언어 태그를 사용하여 언어를 반환하므로 구현 전반에 걸쳐 대부분 신뢰할 수 있는 것으로 보입니다.
불행히도 몇 가지 특이점이 있습니다.
- Android에서 Samsung과 Chrome은 대신 밑줄을 구분 기호로 사용합니다. en_us (관련 문제)
- Android의 Firefox는 언어에 세 글자 코드를 사용하고 끝에 추가 문자열( eng-US-f000 )을 추가하여 훨씬 더 창의적입니다(관련 문제).
default 은 음성이 현재 앱 언어의 기본 음성인지 여부를 나타냅니다. 이론적으로 이것은 매우 유용해야 하지만 실제로는 구현 간의 불일치, 제한된 컨텍스트(시스템 기본값 대 사용자 기본값) 및 언어별 기본 음성 설정 기능 부족으로 인해 실제로 사용하기가 정말 어렵습니다.
default 사용 외에도 구현자는 항상 Accept-Language HTTP 헤더 사용을 고려해야 합니다. 이 헤더에는 특정 사용자가 선호하는 언어/지역의 순서 목록이 포함되어 있기 때문입니다.

기계적 인조 인간

지금은 Google Pixel 기기에서 사용할 수 있는 Android 바닐라 버전에 대한 테스트 및 문서만 다루었습니다. 사용 가능한 음성 목록은 OEM, 장치 및 Android 버전에 따라 크게 다를 수 있습니다.
Android의 특성으로 인해 이러한 모든 변형을 문서화하는 것은 매우 어렵습니다. 이 프로젝트의 향후 버전에서는 디바이스 팜을 사용하여 추가 시도가 이루어질 것입니다(관련 문제).
최신 버전의 바닐라 Android에는 다양한 언어/지역을 포괄하는 탁월한 고품질 음성이 제공됩니다(2024년 4월 현재 67개).
이러한 음성을 사용하려면 사용자는 시스템 설정에서 해당 음성을 다운로드하거나(시스템 언어와 가장 널리 사용되는 일부 언어만 기본적으로 사전 로드됨) 언어/지역별로 선호하는 음성을 선택해야 합니다.
안타깝게도 Android의 Chrome은 사용자가 사용할 수 있는 음성 목록을 반환하지 않고 대신 필터링되지 않은 언어/지역 목록을 반환합니다(관련 문제).
설상가상으로 이러한 음성과 지역은 모두 시스템 로케일로 현지화됩니다.
무엇보다도 이는 음성 팩을 설치해야 하는 언어 및 지역도 Web Speech API(관련 문제)에서 반환된 목록에 표시된다는 것을 의미합니다.
사용자가 음성 팩을 다운로드해야 하는 언어/지역을 선택하면 Chrome은 기본적으로 영어 음성을 대신 사용합니다(관련 문제).
음성 팩이 설치된 경우에도 사용자는 언어/지역을 사용하기 전에 각 지역에 대한 기본 음성을 선택해야 할 수 있습니다.
음성 선택에 대한 이러한 잘못된 접근 방식으로 인해 Android의 Chrome은 default 을 사용하여 사용자가 선호하는 언어/지역을 표시하지 않습니다(관련 문제).

크롬 데스크톱

데스크톱의 경우 Chrome에는 15개 언어에 걸쳐 19개의 제한된 고품질 음성이 사전 로드되어 있습니다.
이러한 모든 음성을 사용하려면 품질이 낮은 오프라인 변형으로 대체하지 않고 온라인 액세스가 필요합니다.
불행하게도 Web Speech API에서 읽은 발언이 14초 이상 걸리고(관련 문제) 경계 이벤트를 반환하지 않는 경우(관련 문제) 이러한 음성은 버그로 인해 어려움을 겪습니다.
현재 상황에서 이러한 Google 음성은 권장 음성 목록에서 Microsoft/Apple 음성보다 우선순위가 낮습니다.
전반적으로 Chrome 데스크톱이 기본적으로 지원되는 음성 및 언어 범위(관련 문제)에 있어서 Android 및 Chrome OS에 비해 크게 뒤떨어져 있다는 점은 불행한 일입니다.

크롬OS

Chrome OS에는 Chrome OS 음성, Android 음성(50개 이상의 언어), 자연 음성 및 eSpeak 음성(38개 언어)의 네 가지 음성 세트가 제공됩니다.
기본적으로 Chrome OS는 시스템 언어에 대한 Chrome OS 음성을 다운로드하며, Android 및 eSpeak 음성은 모든 언어에 사용할 수 있습니다.
Google은 또한 기본적으로 오프라인 작업의 이점을 추가하여 Android 음성의 고품질 변형인 Natural 음성에 대한 지원을 점차적으로 추가하고 있습니다. 자연스러운 음성을 사용하려면 사용자가 시스템 설정으로 이동하여 설치해야 합니다.
Chrome OS에는 새로운 Chrome OS 업데이트가 설치될 때마다 음성 팩을 제거하는 불행한 경향이 있는데, 이는 매우 자주 발생합니다.
대부분의 Android 음성은 오프라인 및 온라인 변형을 제공하며 다운로드 가능한 음성 측면에서 Apple이 제공하는 것과 품질면에서 동등합니다.
이러한 Android 음성은 모든 플랫폼/브라우저에서 최악의 이름을 갖고 있으므로 이 프로젝트에서 제공하는 라벨 재지정 없이는 거의 사용할 수 없습니다.
Android 음성에는 대기 시간 및/또는 가용성 문제도 있습니다. 어떤 경우에는 첫 번째 발화를 소리내어 읽는 데 최대 1분이 걸릴 수 있습니다.
Chrome 음성은 Android 음성보다 한 단계 낮지만 가장 일반적인 언어에 대해 적절한 선택을 제공합니다.
eSpeak 음성은 품질이 매우 낮기 때문에 어떤 대가를 치르더라도 피해야 하며 이를 필터링하기 위해 별도로 문서화했습니다.

가장자리

데스크톱에서 Edge는 75개 언어에 걸쳐 사전 로드된 250개 이상의 음성을 통해 최고의 고품질 음성 선택을 제공합니다(2024년 4월 현재).
소위 "자연스러운" 음성이라고 불리는 이 모든 음성은 기계 학습(ML)에 의존하므로 이를 사용하려면 온라인 액세스가 필요합니다.
그 중 소수의 목소리는 다국어이기도 하며 문장의 언어를 감지하고 그에 따라 적응할 수 있는 것 같습니다. 안타깝게도 문장 중간에 언어 전환이 있는 경우에는 이 방법이 제대로 작동하지 않습니다.
적어도 macOS에는 Edge가 처음에 18개의 자연스러운 음성만 표시하는 이상한 버그가 있지만 Web Speech API를 사용하여 발화를 출력하면 이는 250개 이상으로 확장됩니다.
구현자가 이러한 음성을 사용할 때 알아야 할 추가 문제도 있습니다. 피치 조정을 지원하지 않으며(관련 문제) 재생 문제(관련 문제)를 피하기 위해 여러 문자를 이스케이프해야 합니다.
모바일에서는 Edge가 그다지 흥미롭지 않습니다.
- 빈 음성 목록을 반환하므로 Android에서는 완전히 사용할 수 없으며 이로 인해 Web Speech API(관련 문제)와 함께 사용할 수 없습니다.
- iOS/iPadOS에서는 현재 모든 브라우저가 Safari를 엔진으로 사용해야 합니다. 즉, Edge는 Safari Mobile과 똑같이 작동합니다.

파이어폭스

데스크탑에서 Firefox는 음성 선택과 관련하여 매우 간단해 보입니다.
Chrome 및 Edge와 달리 Firefox에는 자체 음성이 사전 로드되어 있지 않습니다.
Firefox는 각 음성이 고유한 URN으로 식별되는 voiceURI 에 대해 다른 접근 방식을 사용합니다.
이는 Firefox 고유이므로 현재 JSON 파일에는 아직 이러한 URI가 문서화되어 있지 않지만 향후 추가될 수 있습니다.
macOS에서 Firefox가 목록에 새 음성을 표시하려면 전체 시스템을 재부팅해야 합니다.

iOS와 아이패드OS

두 OS 모두 macOS와 동일한 사전 로드된 음성 세트와 다운로드 가능한 음성이 함께 제공됩니다. 사용 가능한 음성에 대한 추가 정보는 아래 macOS 섹션을 읽어보세요.
알 수 없는 이유로 일부 사전 로드된 음성도 두 번 나열되지만 동일한 오디오 출력을 제공합니다.
모든 브라우저는 시스템 webview에서 실행되어야 합니다. 즉, 완전히 다른 브라우저가 아니라 Safari Mobile 위에 있는 셸일 뿐입니다.
이러한 상황은 유럽의 디지털 시장법으로 인해 변경될 수 있으며 이로 인해 Apple은 타사 브라우저 및 웹뷰에 대한 정책을 변경해야 합니다.

macOS

macOS는 사전 로드되거나 다운로드 가능한 45개 언어의 광범위한 음성 목록을 제공합니다.
이러한 음성은 출력 품질(및 다운로드 크기)에 따라 최대 3가지 변형을 가질 수 있습니다.
최고 품질의 음성은 아마도 Siri에서 사용할 수 있는 음성일 것입니다. 하지만 안타깝게도 Web Speech API(관련 문제)를 통해서는 사용할 수 없습니다.
스펙트럼의 반대쪽 끝에 있는 Apple은 Eloquence(8음성) 및 Effects(15음성) 음성 팩과 같이 품질이 낮고 이상한 음성을 광범위하게 사전 로드하려는 불행한 아이디어를 가지고 있었습니다.
이러한 음성의 존재만으로도 macOS 사용자가 사용할 수 있는 음성을 필터링하고 이 저장소에서 권장되는 음성을 강조 표시하는 좋은 이유가 됩니다.
다른 플랫폼/OS와 달리 macOS는 음성 이름을 현지화하기로 결정했습니다. voiceURI 신뢰할 수 있는 음성 식별자로 사용할 수 있다면 문제가 되지 않지만, 그렇지 않습니다(관련 문제).
현재 상태에서 이 저장소는 공식적으로 지원되는 언어에 대한 현지화만 문서화하고 macOS TTS 엔진에서 지원하는 45개 언어는 문서화하지 않습니다.

원정 여행

좋든 나쁘든 Safari의 동작은 데스크톱과 모바일 버전 간에 대부분 일관됩니다.
다운로드 가능한 음성은 Web Speech API에서 반환된 목록에 표시되지 않습니다(관련 문제).
그보다 더 나쁜 것은 사전 로드된 음성의 고품질 변형을 설치하면 이러한 음성이 Safari에서 사라지며, 이는 전체 언어가 완전히 사라질 수 있음을 의미합니다.
Safari에서는 모든 음성이 default 으로 true 반환하므로 시스템/사용자 기본값을 감지하고 선택할 수 없습니다(관련 문제).

윈도우

Microsoft는 Windows 10 및 11에서 사용할 수 있는 모든 음성(36개 언어, 총 98개 음성)을 나열하는 매우 유용한 페이지를 제공합니다.
자연스러운 음성은 훨씬 더 나은 경험을 제공하지만 최신 버전의 Windows 11이 필요하며 다운로드해야 합니다(오프라인에서도 작동한다는 추가 이점도 있음).
Microsoft는 Windows 11 전체에 이러한 자연스러운 목소리를 추가하는 데 시간이 오래 걸렸습니다. 최근까지는 미국 음성(3개 음성)만 사용할 수 있었습니다. 목록은 이제 조금 더 길어졌지만(8개 언어에 23개 음성) Edge를 통해 제공하는 것(75개 언어에 250개 이상의 음성)보다 훨씬 뒤처져 있습니다.
불행하게도 이러한 고품질 음성은 현재 Chrome이나 Firefox에 제대로 표시되지 않습니다(관련 문제). Edge에만 표시되며, 어쨌든 사전 로드되어 있지만 온라인 사용에만 엄격하게 적용됩니다.

확장하다

추가 정보

버전
유형 기타 소스코드
업데이트 시간 2024-12-29
크기 50MB
출처 Github