web speech recommended voices下載 - web speech recommended voices源碼下載

web speech recommended voices

其他源碼

下載

Web Speech API 的推薦語音

該存儲庫是一個更大項目的一部分，旨在確定在閱讀應用程式中實現朗讀功能的最佳實踐。

預設情況下，各種瀏覽器和作業系統都有數百種可用的語音，因此開發人員提供合理的預設值和精選的語音清單可能會很棘手。

該專案專注於語音選擇，其目標是記錄各種平台上可用的更高品質的語音，並提供一種使用 JSON 設定檔實施這些建議的簡單方法。

使用案例

為每種語言提供最佳的預設語音
根據品質顯示有序的語音列表
顯示使用者友善的語音名稱
依性別和年齡過濾建議的聲音（成人與兒童）
過濾掉新奇和低品質的聲音
用測試話語預覽語音

示範

提供基於 Readium Speech 專案的現場演示。

該演示實現了語音選擇的最佳實踐以及該存儲庫中的數據。

支援的語言列表

該專案的目標是支援 Windows 和 macOS 上可用的所有 43 種語言。

目前，它涵蓋 43 種語言：

阿拉伯語（阿爾及利亞、巴林、埃及、伊拉克、約旦、科威特、黎巴嫩、利比亞、摩洛哥、阿曼、卡達、沙烏地阿拉伯、敘利亞、突尼西亞、阿拉伯聯合大公國、葉門）
巴斯克
孟加拉語（印度和孟加拉國）
博傑普爾
保加利亞語
加泰隆尼亞語
中國人：
- 國語（中國大陸、台灣）
- 吳語（又稱“上海人”）
- 粵語（又稱“粵語”）
克羅埃西亞語
捷克語
丹麥語
荷蘭語（荷蘭和比利時）
英文（美國、英國、澳洲、加拿大、香港、印度、愛爾蘭、肯亞、紐西蘭、奈及利亞、蘇格蘭、新加坡、南非和坦尚尼亞）
芬蘭
法語（法國、加拿大、比利時和瑞士）
加利西亞語
德語（德國、奧地利和瑞士）
希臘文
希伯來文
印地語
匈牙利
印尼
義大利語
日本人
卡納達語
韓國人
馬來語
馬拉地語
挪威
波斯語
拋光
葡萄牙語（葡萄牙和巴西）
羅馬尼亞語
俄文
斯洛伐克語
斯洛維尼亞語
西班牙語（西班牙、阿根廷、玻利維亞、智利、哥倫比亞、哥斯大黎加、古巴、多明尼加共和國、厄瓜多、薩爾瓦多、赤道幾內亞、瓜地馬拉、宏都拉斯、墨西哥、尼加拉瓜、巴拿馬、巴拉圭、秘魯、波多黎各、美國、烏拉圭和委內瑞拉）
瑞典
泰米爾語（印度、斯里蘭卡、馬來西亞和新加坡）
泰盧固語
泰國
土耳其
烏克蘭
越南語

要過濾掉的聲音列表

另一方面，該專案也確定了一些應從語音選擇器組件中過濾掉的語音。

其中一些對整體閱讀體驗有害，而另一些則在有更好的預載選項的平台上品質非常低。

新奇的聲音（Apple 裝置）
語音品質非常低（Apple 裝置和 Chrome 作業系統）

指導原則

每個語音清單都是有序的，旨在在此項目涵蓋的所有瀏覽器/作業系統/語言上提供最佳的聆聽體驗。
但每個清單還包括預設選項，以確保始終有可靠的東西可以依靠。
考慮到這兩個目標，較高品質的語音會列在清單的頂部，而較低品質的語音或專門的語音會列在底部。
語音的數量可能看起來令人難以置信（僅英語就有 110 多個語音），但實際上，用戶在每個裝置上只能使用其中的幾個語音。
Web Speech API 傳回的語音名稱很難對使用者友好，這就是為什麼此列表提供通常包含名字（或性別）以及與語音關聯的區域的備用名稱的原因。
只要有可能，我總是會嘗試為兩性提供高品質和預設選項的良好組合。
但該清單必須以某種方式確定優先順序，目前女性聲音排在男性聲音之上。由於與每個聲音相關的性別都被記錄下來，因此實施者可以根據此標準重新排列/過濾清單的優先順序。
區域變體也被分組在一個清單中，而不是故意分開在自己的文件中。在某些設備上，可能只有兩種或三種聲音可用，並且分離區域變體沒有多大意義。
但區域變體必須在清單中以某種方式優先考慮。目前，上面列出了具有最佳語音選擇的區域，但強烈建議實施者考慮使用者的區域偏好。

句法

JSON 模式可用於驗證或有興趣為新語言或語音新增開啟 PR 的潛在貢獻者。

名稱

每個建議的語音都需要name ，它用作本項目中語音的主要識別碼。

名稱在瀏覽器中大多是穩定的，這意味著對於大多數聲音來說，單一字串就足夠了。

但不幸的是，也有一些異常情況：Android、iOS、iPadOS 和 macOS 的聲音。

對於這些聲音，字串的至少一部分通常是本地化的，跨瀏覽器的命名可能不一致，並且它們可能會根據安裝的變體數量而變化。

因此，每個列表還可以包含以下屬性：

altNames包含給定語音的備用字串數組
和localizedName標識用於本地化這些語音的字串模式

範例 3：Apple 預先載入語音的替代版本

{
  "label" : " Samantha (US) " ,
  "name" : " Samantha " ,
  "localizedName" : " apple " ,
  "altNames" : [
    " Samantha (Enhanced) " ,
    " Samantha (English (United States)) "
  ],
  "language" : " en-US "
}

語言

每個推薦的語音都需要language 。

它包含 BCP 47 語言標籤，其中小寫的兩個字母的語言代碼後面跟著大寫的兩個字母的國家/地區代碼。

語言和國家代碼使用連字號 (-) 分隔。

有些語音也能夠處理另一種語言，例如美國的西班牙語語音也可能能夠處理英語。

因此， additionalLanguages屬性也可用，儘管現在很少使用它。

它包含僅使用兩個字母代碼的語言列表，沒有子標籤。

微軟的一些全新聲音也能夠進行多語言輸出。句子中間不支援語言切換，但輸出似乎能夠自動偵測每個句子的語言並相應地採用自身。

為了支援這一點，輸出可能會在此過程中自動切換到不同的聲音。

這些聲音是使用multiLingual布林值來辨識。

範例 4：多語言輸出的語音

{
  "label" : " Emma (US) " ,
  "name" : " Microsoft EmmaMultilingual Online (Natural) - English (United States) " ,
  "language" : " en-US " ,
  "multiLingual" : true
}

範例 5：能夠處理第二語言的語音

{
  "label" : " Sylvie (Canada) " ,
  "name" : " Microsoft Sylvie Online (Natural) - French (Canada) " ,
  "language" : " fr-CA " ,
  "otherLanguages" : [
    " en "
  ]
}

性別與兒童的聲音

gender是每個聲音的可選屬性，記錄與每個聲音相關的性別。

支援以下值： female 、 male或neutral 。

children也是可選的，並使用布林值識別兒童的聲音。

例6：女童聲

{
  "label" : " Ana (US) " ,
  "name" : " Microsoft Ana Online (Natural) - English (United States) " ,
  "language" : " en-US " ,
  "gender" : " female " ,
  "children" : true
}

品質

quality是每個語音的可選屬性，它記錄了語音各種變體的品質。

支援以下值：

非常高: 非常高、幾乎人類無法分辨的語音合成質量
高的: 高品質、類人語音合成
普通的: 語音合成的正常質量
低的: 語音合成品質低，不符合人類的水平
極低: 語音合成的品質非常低，但仍然可以理解

範例 7：Apple 語音有三種品質變體

{
  "label" : " Ava (US) " ,
  "name" : " Ava " ,
  "note" : " This voice can be installed on all Apple devices and offers three variants. Like all voices that can be installed on Apple devices, it suffers from inconsistent naming due to localization. " ,
  "altNames" : [
    " Ava (Premium) " ,
    " Ava (Enhanced) " ,
    " Ava (English (United States)) " ,
  ],
  "language" : " en-US " ,
  "gender" : " female " ,
  "quality" : [
    " low " ,
    " normal " ,
    " high "
  ],
  "rate" : 1 ,
  "pitch" : 1 ,
  "os" : [
    " macOS " ,
    " iOS " ,
    " iPadOS "
  ]
}

作業系統和瀏覽器

os和browser都是可選屬性。它們用於指示哪些作業系統和瀏覽器可以使用語音。

這兩個屬性應該單獨解釋，而不是作為組合來解釋。

範例 8：Edge 和 Windows 中均提供 Microsoft 語音

{
  "label" : " Denise (France) " ,
  "name" : " Microsoft Denise Online (Natural) - French (France) " ,
  "note" : " This voice is preloaded in Edge on desktop. In other browsers, it requires the user to run Windows 11 and install the voice pack. " ,
  "language" : " fr-FR " ,
  "gender" : " female " ,
  "os" : [
    " Windows "
  ],
  "browser" : [
    " Edge "
  ]
}

此外， preloaded表示語音是否已預先載入到已識別的所有作業系統和瀏覽器中。

使用目前方法，無法表明語音在 Chrome 和 Windows 上可用，但需要在 Windows 上下載。

範例 9：Chrome 桌面中預先載入的 Google 語音

{
  "label" : " Google female voice (UK) " ,
  "name" : " Google UK English Female " ,
  "language" : " en-GB " ,
  "gender" : " female " ,
  "browser" : [
    " ChromeDesktop "
  ],
  "preloaded" : true
}

語速和音調

使用 Web Speech API 時， SpeechSynthesisUtterance支援以下選用值：

rate來控制語速
和pitch來控制音調

此儲存庫中記錄的每個語音都支援以下可選屬性：

pitchControl是一個布林值，預設為true ，指示語音是否可以進行音調控制
rate是 0.1 到 10 之間的整數，預設為 1，並為每個語音提供建議的預設語速
pitch是 0 到 2 之間的整數，預設為 1，並為每個語音提供建議的預設音高

範例 10：無法調整音調的 Microsoft 語音

{
  "label" : " Ana (US) " ,
  "name" : " Microsoft Ana Online (Natural) - English (United States) " ,
  "language" : " en-US " ,
  "gender" : " female " ,
  "pitchControl" : false
}

範例 11：具有推薦音調和速度的 Google 語音

{
  "label" : " Voix Google féminine (France) " ,
  "name" : " Google français " ,
  "language" : " fr-FR " ,
  "gender" : " female " ,
  "rate" : 1 ,
  "pitch" : 0.8
}

附加說明

透過記錄推薦聲音清單的工作，我還最終測試了各種瀏覽器/作業系統以了解它們的行為方式。本節旨在總結其中一些資訊。

還可以使用專用標籤來追蹤向 Apple、Google、Microsoft 或 Mozilla 報告的外部問題。

一般的

Web Speech API 透過getVoices()方法傳回以下欄位： name 、 voiceURI 、 lang 、 localService和default 。
雖然從理論上講， voiceURI應該是識別語音的最一致的方式，但在實踐中，這與事實相差甚遠。大多數瀏覽器使用與voiceURI name相同的值，並且不強制唯一性。
正如我們將在特定瀏覽器/作業系統的註釋中看到的那樣， name的實作也不一致，並且可以為同一裝置上的相同語音傳回不同的值。
localService指示語音是否可用於離線使用，而且它似乎按預期工作，這就是當前推薦語音清單不包含該資訊的原因。
lang似乎在跨實作上最可靠，傳回使用 BCP 47 語言標籤的語言，主語言為小寫，子標籤為大寫 ( pt-BR )。
不幸的是，有一些異常值：
- 在 Android 上，三星和 Chrome 使用底線作為分隔符號： en_us （相關問題）
- Android 上的 Firefox 變得更有創意，使用三個字母代碼表示語言，並在末尾添加一個額外的字串： eng-US-f000 （相關問題）
default旨在指示語音是否是目前應用程式語言的預設語音。從理論上講，這應該非常有用，但在實踐中，由於實現之間的不一致、有限的上下文（系統預設與用戶預設）以及缺乏為每種語言設定預設語音的功能，它確實很難使用。
除了使用default之外，實作者還應該考慮使用Accept-Language HTTP 標頭，因為它包含給定使用者的首選語言/區域的有序清單。

安卓

目前，我們僅介紹了 Android 普通版（Google Pixel 裝置上提供的）的測試和文件。可用語音清單可能會因 OEM、裝置和 Android 版本而異。
由於 Android 的性質，記錄所有這些變化將非常困難。該專案的未來版本將透過使用設備場（相關問題）進行進一步的嘗試。
在最新版本的 vanilla Android 中，提供了一系列精選的高品質語音，涵蓋多種語言/地區（截至 2024 年 4 月有 67 種語言/地區）。
要使用這些語音，用戶需要深入了解系統設置，要么下載它們（默認情況下僅預先加載您的系統語言和一些最受歡迎的語言），要么根據語言/區域選擇他們喜歡的語音。
不幸的是，Android 上的 Chrome 不會傳回用戶可用的語音列表，而是傳回未經過濾的語言/區域列表（相關問題）。
更糟的是，這些聲音和區域都是透過系統區域設定進行在地化的。
除此之外，這意味著甚至需要安裝語音包的語言和區域也會顯示在 Web Speech API 傳回的清單中（相關問題）。
如果使用者選擇需要下載語音包的語言/區域，Chrome 將預設使用英語語音（相關問題）。
即使已經安裝了語音包，使用者也可能需要為每個區域選擇預設語音，然後才能使用語言/區域。
由於這種糟糕的語音選擇方法，Android 上的 Chrome 不會使用default來指示使用者的首選語言/區域（相關問題）。

Chrome 桌面版

在桌面上，Chrome 預先安裝了 15 種語言的 19 種高品質語音的有限選擇。
所有這些聲音都需要在線訪問才能使用它們，而不會退回到質量較低的離線變體。
不幸的是，如果 Web Speech API 讀取的任何話語花費的時間超過 14 秒（相關問題）並且不返回邊界事件（相關問題），這些語音也會受到錯誤的困擾。
目前情況下，在推薦聲音清單中，這些谷歌聲音的優先順序低於微軟/蘋果的同類聲音。
總的來說，不幸的是，在預設支援的語音和語言範圍（相關問題）方面，Chrome 桌面版遠遠落後於 Android 和 Chrome 作業系統。

Chrome作業系統

Chrome OS 附帶四組語音：Chrome OS 語音、Android 語音（50 多種語言）、Natural 語音和 eSpeak 語音（38 種語言）。
預設情況下，Chrome 作業系統會下載適合您的系統語言的 Chrome 作業系統語音，而 Android 和 eSpeak 語音則適用於所有語言。
谷歌還逐漸增加對自然語音的支持，這基本上是 Android 語音的更高品質變體，並具有離線工作的額外好處。自然聲音需要使用者進入系統設定來安裝它們。
不幸的是，每當安裝新的 Chrome 作業系統更新時，Chrome 作業系統就會卸載語音包，這種情況經常發生。
大多數 Android 語音都提供離線和線上變體，而且它們在品質方面與 Apple 提供的可下載語音相當。
這些 Android 聲音在任何平台/瀏覽器上都有一些最糟糕的名稱，如果沒有這個專案提供的重新標籤，它們幾乎無法使用。
Android 語音也存在延遲和/或可用性問題。在某些情況下，可能需要一分鐘才能大聲朗讀第一句話。
Chrome 語音比 Android 語音低一級，但它們為最常見的語言提供了不錯的選擇。
應不惜一切代價避免 eSpeak 語音，因為它們的品質極低，並且已單獨記錄以將其過濾掉。

邊緣

在桌面上，Edge 提供了最佳的高品質語音選擇，包含 75 種語言的 250 多種預先載入語音（截至 2024 年 4 月）。
所有這些所謂的「自然」聲音都依賴機器學習 (ML)，因此需要線上存取才能使用它們。
其中一小部分聲音也是多語言的，似乎能夠偵測句子的語言並做出相應的調整。不幸的是，當句子中間有語言切換時，這種方法就不起作用了。
至少在 macOS 上，有一個奇怪的錯誤，Edge 最初只顯示 18 種自然語音，但一旦使用 Web Speech API 輸出語音，就會擴展到 250 多種。
使用這些聲音時，實施者還應該注意其他問題：它們不支援音高調整（相關問題），並且需要轉義許多字元以避免播放問題（相關問題）。
在行動裝置上，Edge 就沒那麼有趣了：
- 它在 Android 上完全無法使用，因為它會傳回空的語音列表，這使得它無法與 Web Speech API 一起使用（相關問題）。
- 在 iOS/iPadOS 上，所有瀏覽器目前都被迫使用 Safari 作為引擎，這意味著 Edge 的行為與 Safari Mobile 完全相同。

火狐瀏覽器

在桌面上，Firefox 在語音選擇方面似乎相當簡單。
與 Chrome 和 Edge 不同，Firefox 本身沒有任何預先載入的聲音。
Firefox 對於voiceURI有一種不同的方法，其中每個語音都由唯一的 URN 真正標識。
由於這是 Firefox 所獨有的，目前的 JSON 檔案尚未記錄這些 URI，但這可能是未來的補充。
在 macOS 上，Firefox 需要完全重新啟動系統才能使新聲音顯示在清單中。

iOS 和 iPadOS

這兩個作業系統都配備了與 macOS 相同的一組預先載入語音和可下載語音。請閱讀下面的 macOS 部分，以了解有關可用語音的更多資訊。
由於未知原因，一些預先載入的語音也列出了兩次，但提供相同的音訊輸出。
所有瀏覽器都需要在系統 webview 上運行，這意味著它們只是 Safari Mobile 之上的一個外殼，而不是真正不同的瀏覽器。
這種情況可能會因歐洲的數位市場法案而改變，迫使蘋果改變對第三方瀏覽器和網頁視圖的政策。

macOS

macOS 提供了涵蓋 45 種語言的廣泛語音列表，包括預先載入或可下載的。
根據輸出的品質（和下載大小），這些聲音最多可以有三種不同的變體。
Siri 可能可以使用最高品質的語音，但不幸的是，它們無法透過 Web Speech API 獲得（相關問題）。
另一方面，蘋果公司有一個不幸的想法，即預先加載大量低品質和奇怪的聲音，例如 Eloquence（8 個聲音）和 Effects（15 個聲音）語音包。
這些聲音的存在本身就是過濾 macOS 用戶可用的聲音並突出顯示此存儲庫中推薦的聲音的充分理由。
與其他平台/作業系統不同，macOS 決定在地化語音名稱。如果voiceURI可以用作語音的可靠標識符，那麼這不會成為問題，但事實並非如此（相關問題）。
在目前狀態下，此儲存庫僅記錄官方支援的語言的本地化，而不是 macOS TTS 引擎支援的 45 種語言。

狩獵之旅

無論好壞，Safari 的桌面版和行動版的行為基本上都一致。
可下載的語音不會顯示在 Web Speech API 傳回的清單中（相關問題）。
更糟的是，當安裝更高品質的預先載入語音變體時，這些語音會在 Safari 中消失，這意味著整個語言可能會完全消失。
在 Safari 中，所有語音default回傳true ，這使得無法偵測並選擇系統/使用者預設值（相關問題）。

視窗

Microsoft 提供了一個非常有用的頁面，列出了 Windows 10 和 11 上可用的所有語音，總共 36 種語言的 98 種語音。
自然語音提供了更好的體驗，但它們需要最新版本的 Windows 11 並且需要下載（還有一個額外的好處，它們也可以離線工作）。
微軟在將這些自然聲音添加到整體 Windows 11 方面進展緩慢。直到最近，還只能使用美國語音（3 個語音）。該清單現在稍長一些（跨 8 種語言的 23 種語音），但仍遠遠落後於他們透過 Edge 提供的內容（跨 75 種語言的 250 多種語音）。
不幸的是，這些更高品質的聲音目前沒有在 Chrome 或 Firefox 中正確列出（相關問題）。它們只出現在 Edge 中，無論如何它們都會預先加載，但僅限於線上使用。

展開

附加信息

版本
類型其他源碼
更新時間 2024-12-29
大小 50MB
來自於 Github

相關應用

Web Resource Downloader

2024-11-13
opcon web installer

2024-11-12
spotify web downloader

2024-11-10
web php

2024-11-06
Web crawler novels

2024-11-05
網路奇才論壇

2022-05-27

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
waymo open dataset

其他源碼

December 2023 Update
SmartTube

其他源碼

24.71 Stable
Sunamu

其他源碼

Release 2.2.0
waymo open dataset

其他源碼

December 2023 Update
termwind

其他類別

v2.3.0
wp functions

其他類別

1.0.0

相關資訊全部