Voix recommandées pour l'API Web Speech
Ce référentiel fait partie d'un projet plus vaste, destiné à identifier les meilleures pratiques pour implémenter une fonctionnalité de lecture à haute voix dans les applications de lecture.
Avec des centaines de voix disponibles par défaut sur différents navigateurs et systèmes d'exploitation, il peut être difficile pour les développeurs de fournir des valeurs par défaut raisonnables et une liste de voix organisée.
En mettant l'accent sur la sélection des voix, l'objectif de ce projet est de documenter les voix de meilleure qualité disponibles sur diverses plates-formes et de fournir un moyen simple de mettre en œuvre ces recommandations à l'aide de fichiers de configuration JSON.
Cas d'utilisation
- Fournir la meilleure voix par défaut possible par langue
- Affichage d'une liste ordonnée de voix, basée sur la qualité
- Affichage de noms vocaux conviviaux
- Filtrage des voix recommandées par sexe et âge (adultes vs enfants)
- Filtrage des voix inédites et de mauvaise qualité
- Prévisualiser une voix avec un énoncé test
Démo
Une démo en direct basée sur le projet Readium Speech est disponible.
Cette démo implémente les deux meilleures pratiques pour la sélection vocale ainsi que les données de ce référentiel.
Liste des langues prises en charge
L'objectif de ce projet est de prendre en charge les 43 langues disponibles sur Windows et macOS.
Dans son état actuel, il couvre 43 langues :
- Arabe (Algérie, Bahreïn, Égypte, Irak, Jordanie, Koweït, Liban, Libye, Maroc, Oman, Qatar, Arabie Saoudite, Syrie, Tunisie, Émirats arabes unis, Yémen)
- Basque
- Bengali (Inde et Bangladesh)
- Bhojpuri
- bulgare
- catalan
- Chinois:
- Chinois mandarin (Chine continentale, Taiwan)
- Chinois Wu (alias « Shanghaïen »)
- Yue chinois (alias « cantonais »)
- croate
- tchèque
- danois
- Néerlandais (Pays-Bas et Belgique)
- Anglais (États-Unis, Royaume-Uni, Australie, Canada, Hong Kong, Inde, Irlande, Kenya, Nouvelle-Zélande, Nigéria, Écosse, Singapour, Afrique du Sud et Tanzanie)
- finlandais
- Français (France, Canada, Belgique et Suisse)
- Galicien
- Allemand (Allemagne, Autriche et Suisse)
- grec
- hébreu
- hindi
- hongrois
- indonésien
- italien
- japonais
- Kannada
- coréen
- malais
- Marathi
- norvégien
- persan
- polonais
- Portugais (Portugal et Brésil)
- roumain
- russe
- slovaque
- slovène
- Espagnol (Espagne, Argentine, Bolivie, Chili, Colombie, Costa Rica, Cuba, République dominicaine, Équateur, El Salvador, Guinée équatoriale, Guatemala, Honduras, Mexique, Nicaragua, Panama, Paraguay, Pérou, Porto Rico, États-Unis, Uruguay et Venezuela)
- suédois
- Tamoul (Inde, Sri Lanka, Malaisie et Singapour)
- Télougou
- thaïlandais
- turc
- ukrainien
- vietnamien
Liste des voix à filtrer
À l'autre extrémité du spectre, ce projet identifie également un certain nombre de voix qui doivent être filtrées à partir d'un composant de sélection de voix.
Certains d’entre eux nuisent à l’expérience de lecture globale, tandis que d’autres ont une qualité très faible sur les plateformes où de meilleures options préchargées sont disponibles.
- Voix nouveautés (appareils Apple)
- Voix de très mauvaise qualité (appareils Apple et Chrome OS)
Principes directeurs
- Chaque liste vocale est ordonnée et destinée à offrir une expérience d'écoute optimale sur tous les navigateurs/OS/langues couverts par ce projet.
- Mais chaque liste comprend également des options par défaut, pour garantir qu'il y a toujours quelque chose de fiable sur lequel s'appuyer.
- En gardant ces deux objectifs à l’esprit, les voix de qualité supérieure sont répertoriées en haut de la liste, tandis que les voix de qualité inférieure ou spécialisées sont répertoriées en bas.
- Le nombre de voix peut paraître écrasant (plus de 110 voix rien qu'en anglais), mais en pratique, seules quelques-unes d'entre elles seront disponibles pour les utilisateurs sur chacun de leurs appareils.
- Les noms de voix renvoyés par l'API Web Speech sont peu conviviaux, c'est la raison pour laquelle cette liste en propose d'autres qui incluent généralement un prénom (ou un sexe) ainsi que la région associée à la voix.
- Dans la mesure du possible, j'essaierai toujours d'inclure un bon mélange d'options de haute qualité et par défaut pour les deux sexes.
- Mais la liste doit être priorisée d’une manière ou d’une autre, les voix féminines étant actuellement répertoriées avant celles de leurs homologues masculins. Étant donné que le sexe associé à chaque voix est documenté, cela permet aux responsables de la mise en œuvre de redéfinir la priorité/filtrer la liste en fonction de ce critère.
- Les variantes régionales sont également regroupées dans une seule liste plutôt que volontairement séparées dans leurs propres fichiers. Sur certains appareils, seules deux ou trois voix peuvent être disponibles et séparer les variantes régionales n'aurait pas beaucoup de sens.
- Mais les variantes régionales doivent être priorisées d’une manière ou d’une autre dans la liste. Pour l'instant, les régions offrant les meilleures sélections de voix sont répertoriées ci-dessus, mais il est fortement recommandé aux responsables de la mise en œuvre de prendre en compte les préférences régionales de l'utilisateur.
Syntaxe
Un schéma JSON est disponible pour validation ou pour les contributeurs potentiels intéressés par l'ouverture d'un PR pour de nouvelles langues ou des ajouts vocaux.
Étiquette
label
est requise pour chaque voix recommandée et fournit une étiquette conviviale pour chaque voix.
Cette chaîne est localisée pour la langue cible et contient généralement les informations suivantes :
- Prénom (si disponible)
- Sexe (lorsque le prénom manque)
- Pays/région
Exemple 1 : voix Microsoft Natural
Bien que les noms documentés par Microsoft pour leurs voix naturelles soient facilement compréhensibles, ils ont tendance à être très longs et sont tous localisés en anglais.
{
"label" : " Isabella (Italia) " ,
"name" : " Microsoft Isabella Online (Natural) - Italian (Italy) " ,
"language" : " it-IT "
}
Exemple 2 : voix Chrome OS
Chrome OS fournit un certain nombre de voix de haute qualité via ses sous-systèmes Android, mais elles portent certains des pires noms possibles pour un utilisateur final.
{
"label" : " Female voice 1 (US) " ,
"name" : " Android Speech Recognition and Synthesis from Google en-us-x-tpc-network " ,
"language" : " en-US "
}
Noms
name
est requis pour chaque voix recommandée et il est utilisé comme identifiant principal pour les voix de ce projet.
Les noms sont pour la plupart stables sur tous les navigateurs, ce qui signifie que pour la plupart des voix, une seule chaîne suffit.
Mais il existe malheureusement quelques valeurs aberrantes : les voix Android, iOS, iPadOS et macOS.
Pour ces voix, au moins une partie de la chaîne est souvent localisée, la dénomination peut être incohérente d'un navigateur à l'autre et elle peut changer en fonction du nombre de variantes installées.
De ce fait, chaque liste peut également contenir les propriétés suivantes :
-
altNames
avec un tableau de chaînes alternatives pour une voix donnée - et
localizedName
qui identifie le modèle de chaîne utilisé pour localiser ces voix
Exemple 3 : version alternative d'une voix Apple préchargée
{
"label" : " Samantha (US) " ,
"name" : " Samantha " ,
"localizedName" : " apple " ,
"altNames" : [
" Samantha (Enhanced) " ,
" Samantha (English (United States)) "
],
"language" : " en-US "
}
Langues
language
est requise pour chaque voix recommandée.
Il contient une balise de langue BCP 47 où un code de langue à deux lettres en minuscule est suivi d'un code de pays à deux lettres en majuscule.
Les codes de langue et de pays sont séparés par un trait d'union (-).
Certaines voix sont également capables de gérer une autre langue, par exemple une voix espagnole pour les États-Unis pourrait également être capable de gérer l'anglais.
Pour cette raison, une propriété additionalLanguages
est également disponible bien qu'elle soit assez rarement utilisée pour le moment.
Il contient une liste de langues utilisant uniquement des codes à deux lettres, sans sous-balise.
Certaines toutes nouvelles voix de Microsoft sont également capables d'une sortie multilingue. Le changement de langue n'est pas pris en charge au milieu d'une phrase, mais la sortie semble capable de détecter automatiquement la langue de chaque phrase et de s'adopter en conséquence.
Afin de prendre en charge cela, la sortie peut automatiquement passer à une voix différente au cours du processus.
Ces voix sont identifiées à l'aide du booléen multiLingual
.
Exemple 4 : Voix avec une sortie multilingue
{
"label" : " Emma (US) " ,
"name" : " Microsoft EmmaMultilingual Online (Natural) - English (United States) " ,
"language" : " en-US " ,
"multiLingual" : true
}
Exemple 5 : Voix capable de gérer une langue secondaire
{
"label" : " Sylvie (Canada) " ,
"name" : " Microsoft Sylvie Online (Natural) - French (Canada) " ,
"language" : " fr-CA " ,
"otherLanguages" : [
" en "
]
}
Voix du genre et des enfants
gender
est une propriété facultative pour chaque voix, qui documente le genre associé à chaque voix.
Les valeurs suivantes sont prises en charge : female
, male
ou neutral
.
children
est également facultatif et identifie les voix des enfants à l'aide d'un booléen.
Exemple 6 : Voix d'enfants de sexe féminin
{
"label" : " Ana (US) " ,
"name" : " Microsoft Ana Online (Natural) - English (United States) " ,
"language" : " en-US " ,
"gender" : " female " ,
"children" : true
}
Qualité
quality
est une propriété facultative pour chaque voix, qui documente la qualité des différentes variantes d'une voix.
Les valeurs suivantes sont prises en charge :
- très élevé
- Qualité de synthèse vocale très élevée, presque impossible à distinguer par l'homme
- haut
- Qualité de synthèse vocale élevée, semblable à celle d'un humain
- normale
- Qualité normale de la synthèse vocale
- faible
- Qualité de synthèse vocale faible, pas humaine
- très faible
- Qualité de synthèse vocale très faible, mais toujours intelligible
Exemple 7 : Une voix Apple disponible en trois variantes de qualité
{
"label" : " Ava (US) " ,
"name" : " Ava " ,
"note" : " This voice can be installed on all Apple devices and offers three variants. Like all voices that can be installed on Apple devices, it suffers from inconsistent naming due to localization. " ,
"altNames" : [
" Ava (Premium) " ,
" Ava (Enhanced) " ,
" Ava (English (United States)) " ,
],
"language" : " en-US " ,
"gender" : " female " ,
"quality" : [
" low " ,
" normal " ,
" high "
],
"rate" : 1 ,
"pitch" : 1 ,
"os" : [
" macOS " ,
" iOS " ,
" iPadOS "
]
}
Système d'exploitation et navigateur
Le os
et browser
sont des propriétés facultatives. Ils sont utilisés pour indiquer dans quels systèmes d'exploitation et navigateurs une voix est disponible.
Ces deux propriétés doivent être interprétées séparément et non comme une combinaison.
Exemple 8 : une voix Microsoft disponible à la fois dans Edge et Windows
{
"label" : " Denise (France) " ,
"name" : " Microsoft Denise Online (Natural) - French (France) " ,
"note" : " This voice is preloaded in Edge on desktop. In other browsers, it requires the user to run Windows 11 and install the voice pack. " ,
"language" : " fr-FR " ,
"gender" : " female " ,
"os" : [
" Windows "
],
"browser" : [
" Edge "
]
}
De plus, preloaded
indique si la voix est préchargée dans tous les systèmes d'exploitation et navigateurs identifiés.
Avec l'approche actuelle, il n'est pas possible d'indiquer qu'une voix est disponible sur Chrome et Windows, mais nécessite un téléchargement sur Windows par exemple.
Exemple 9 : une voix Google préchargée dans Chrome Desktop
{
"label" : " Google female voice (UK) " ,
"name" : " Google UK English Female " ,
"language" : " en-GB " ,
"gender" : " female " ,
"browser" : [
" ChromeDesktop "
],
"preloaded" : true
}
Débit et hauteur de parole
Lors de l'utilisation de l'API Web Speech, SpeechSynthesisUtterance
prend en charge les valeurs facultatives pour :
-
rate
pour contrôler le débit de parole - et
pitch
pour contrôler le pitch
Chaque voix documentée dans ce référentiel prend en charge les propriétés facultatives suivantes :
-
pitchControl
est un booléen qui est par défaut true
et indique si une voix peut être contrôlée par la hauteur. -
rate
est un nombre entier compris entre 0,1 et 10, dont la valeur par défaut est 1 et qui fournit un débit de parole par défaut recommandé pour chaque voix. -
pitch
est un nombre entier compris entre 0 et 2 dont la valeur par défaut est 1 et fournit une hauteur par défaut recommandée pour chaque voix
Exemple 10 : Microsoft Voice où la hauteur ne peut pas être ajustée
{
"label" : " Ana (US) " ,
"name" : " Microsoft Ana Online (Natural) - English (United States) " ,
"language" : " en-US " ,
"gender" : " female " ,
"pitchControl" : false
}
Exemple 11 : Voix Google avec les taux de pitch et de vitesse recommandés
{
"label" : " Voix Google féminine (France) " ,
"name" : " Google français " ,
"language" : " fr-FR " ,
"gender" : " female " ,
"rate" : 1 ,
"pitch" : 0.8
}
Notes complémentaires
Grâce au travail effectué pour documenter une liste de voix recommandées, j'ai également fini par tester différents navigateurs/OS pour voir comment ils se comportent. Cette section a pour but de résumer certaines de ces informations.
Une étiquette dédiée est également disponible pour suivre les problèmes externes signalés à Apple, Google, Microsoft ou Mozilla.
Général
- L'API Web Speech renvoie les champs suivants via la méthode
getVoices()
: name
, voiceURI
, lang
, localService
et default
. - Bien que
voiceURI
devrait être le moyen le plus cohérent d'identifier une voix en théorie, en pratique, cela ne pourrait être plus éloigné de la vérité. La plupart des navigateurs utilisent la même valeur que name
pour voiceURI
et n'imposent pas l'unicité. - Comme nous le verrons dans les notes relatives aux navigateurs/OS spécifiques,
name
est également implémenté de manière incohérente et peut renvoyer des valeurs différentes pour la même voix sur le même appareil. -
localService
indique si une voix est disponible pour une utilisation hors ligne et si elle semble fonctionner comme prévu, c'est pourquoi la liste actuelle des voix recommandées ne contient pas cette information. -
lang
semble être généralement fiable dans toutes les implémentations, renvoyant une langue en utilisant les balises de langue BCP 47, avec la langue principale en minuscule et la sous-balise en majuscule ( pt-BR
). - Il existe malheureusement quelques valeurs aberrantes :
- Sur Android, Samsung et Chrome utilisent plutôt un trait de soulignement comme séparateur :
en_us
(problème lié) - Tandis que Firefox sur Android devient encore plus créatif, en utilisant des codes à trois lettres pour les langues et en ajoutant une chaîne supplémentaire à la fin :
eng-US-f000
(problème connexe)
-
default
est destinée à indiquer si une voix est la voix par défaut pour la langue actuelle de l'application. En théorie, cela devrait être extrêmement utile, mais en pratique, il est très difficile à utiliser en raison d'incohérences entre les implémentations, d'un contexte limité (par défaut du système par rapport à celui de l'utilisateur) et du manque de capacité à définir une voix par défaut par langue. - En plus de l'utilisation de
default
, les implémenteurs doivent toujours envisager d'utiliser également l'en-tête HTTP Accept-Language
, car il contient une liste ordonnée de langues/régions préférées pour un utilisateur donné.
Androïde
- Pour l'instant, nous n'avons couvert que les tests et la documentation sur les versions vanille d'Android, disponibles sur les appareils Google Pixel. La liste des voix disponibles peut varier considérablement en fonction de l'OEM, de l'appareil et de la version Android.
- En raison de la nature d’Android, il sera très difficile de documenter toutes ces variations. D'autres tentatives seront faites dans la future version de ce projet grâce à l'utilisation de fermes de périphériques (problème connexe).
- Dans les versions récentes d'Android Vanilla, il existe une excellente sélection de voix de haute qualité qui couvrent un large éventail de langues/régions (67 en avril 2024).
- Pour utiliser ces voix, l'utilisateur doit approfondir les paramètres du système soit pour les télécharger (seules la langue de votre système et certaines des langues les plus populaires sont préchargées par défaut), soit pour sélectionner sa voix préférée par langue/région.
- Malheureusement, Chrome sur Android ne renvoie pas la liste des voix disponibles pour les utilisateurs, mais renvoie une liste non filtrée de langues/régions (problème connexe).
- Pour aggraver les choses, ces voix et régions sont toutes localisées avec les paramètres régionaux du système.
- Entre autres choses, cela signifie que même les langues et les régions qui nécessitent l'installation d'un pack vocal apparaîtront dans la liste renvoyée par l'API Web Speech (problème connexe).
- Si l'utilisateur sélectionne une langue/région pour laquelle le pack vocal doit être téléchargé, Chrome utilisera par défaut une voix anglaise (problème connexe).
- Même lorsqu'un pack vocal a été installé, l'utilisateur devra peut-être sélectionner une voix par défaut pour chaque région avant de pouvoir utiliser une langue/une région.
- Avec cette mauvaise approche de la sélection vocale, Chrome sur Android n'indique pas non plus la langue/région préférée de l'utilisateur par
default
(problème connexe).
Bureau Chrome
- Sur ordinateur, Chrome est préchargé avec une sélection limitée de 19 voix de haute qualité dans 15 langues.
- Toutes ces voix nécessitent un accès en ligne pour pouvoir être utilisées, sans aucun recours à une variante hors ligne de moindre qualité.
- Malheureusement, ces voix sont également en proie à un bug si un énoncé lu par l'API Web Speech prend plus de 14 secondes (problème connexe) et ne renvoie pas d'événements de limite (problème connexe).
- Dans les circonstances actuelles, ces voix de Google ont reçu une priorité inférieure à celle de leurs homologues de Microsoft/Apple dans la liste des voix recommandées.
- Dans l'ensemble, il est dommage que Chrome Desktop soit loin derrière Android et Chrome OS en ce qui concerne la gamme de voix et de langues prises en charge par défaut (problème connexe).
Système d'exploitation Chrome
- Chrome OS est livré avec quatre ensembles de voix : les voix Chrome OS, les voix Android (plus de 50 langues), les voix naturelles et les voix eSpeak (38 langues).
- Par défaut, Chrome OS télécharge les voix Chrome OS pour la langue de votre système, tandis que les voix Android et eSpeak sont disponibles pour toutes les langues.
- Google ajoute également progressivement la prise en charge des voix naturelles, qui sont essentiellement les variantes de meilleure qualité de leurs voix Android avec l'avantage supplémentaire de travailler hors ligne. Les voix naturelles nécessitent que l'utilisateur accède aux paramètres de son système pour les installer.
- Chrome OS a une fâcheuse tendance à désinstaller les packs vocaux chaque fois qu'une nouvelle mise à jour de Chrome OS est installée, ce qui arrive très souvent.
- La plupart des voix Android proposent des variantes hors ligne et en ligne et elles sont comparables en termes de qualité à ce que propose Apple en termes de voix téléchargeables.
- Ces voix Android portent certains des pires noms sur n'importe quelle plate-forme/navigateur, ce qui les rend difficilement utilisables sans le type de réétiquetage proposé par ce projet.
- Les voix Android souffrent également de problèmes de latence et/ou de disponibilité. Dans certains cas, la lecture à haute voix du premier énoncé peut prendre jusqu'à une minute.
- Les voix Chrome sont un cran en dessous des voix Android, mais elles offrent une sélection décente pour les langues les plus courantes.
- Les voix eSpeak doivent être évitées à tout prix en raison de leur qualité extrêmement faible et ont été documentées séparément afin de les filtrer.
Bord
- Sur ordinateur, Edge offre la meilleure sélection de voix de haute qualité avec plus de 250 voix préchargées dans 75 langues (en avril 2024).
- Toutes ces voix dites « naturelles » s’appuient sur le Machine Learning (ML) et nécessitent donc un accès en ligne pour les utiliser.
- Un petit nombre de ces voix sont également multilingues et semblent capables de détecter la langue d'une phrase et de s'adapter en conséquence. Malheureusement, cela ne fonctionne pas aussi bien lorsqu'il y a un changement de langue au milieu d'une phrase.
- Sur macOS au moins, il y a un bug étrange où Edge n'affiche initialement que 18 voix naturelles, mais cela s'étend à plus de 250 une fois que l'API Web Speech a été utilisée pour produire un énoncé.
- Il existe également des problèmes supplémentaires dont les développeurs doivent être conscients lors de l'utilisation de ces voix : elles ne prennent pas en charge le réglage de la hauteur (problème connexe) et un certain nombre de caractères doivent être échappés pour éviter les problèmes de lecture (problème connexe).
- Sur mobile, Edge n'est pas aussi intéressant :
- Il est totalement inutilisable sur Android puisqu'il renvoie une liste de voix vide, ce qui rend impossible son utilisation avec l'API Web Speech (problème lié).
- Sur iOS/iPadOS, tous les navigateurs sont actuellement obligés d'utiliser Safari comme moteur, ce qui signifie qu'Edge se comporte exactement comme Safari Mobile.
Firefox
- Sur ordinateur, Firefox semble assez simple en matière de sélection vocale.
- Contrairement à Chrome et Edge, Firefox ne propose aucune voix préchargée.
- Firefox a une approche différente pour
voiceURI
où chaque voix est véritablement identifiée par un URN unique. - Comme cela est unique à Firefox, les fichiers JSON actuels ne documentent pas encore ces URI, mais cela pourrait être un ajout futur.
- Sur macOS, Firefox nécessite un redémarrage complet du système pour que les nouvelles voix apparaissent dans la liste.
iOS et iPadOS
- Les deux systèmes d'exploitation sont livrés avec le même ensemble de voix préchargées et de voix téléchargeables que macOS. Lisez la section macOS ci-dessous pour plus d'informations sur les voix disponibles.
- Pour une raison inconnue, certaines voix préchargées sont également répertoriées deux fois mais fournissent la même sortie audio.
- Tous les navigateurs doivent fonctionner sur la vue Web du système, ce qui signifie qu'ils ne sont qu'un shell au-dessus de Safari Mobile plutôt que des navigateurs véritablement différents.
- Cette situation pourrait changer en raison du Digital Market Act en Europe, obligeant Apple à modifier sa politique concernant les navigateurs et les vues Web tiers.
macOS
- macOS fournit une liste complète de voix dans 45 langues, préchargées ou téléchargeables.
- Ces voix peuvent avoir jusqu'à trois variantes différentes, en fonction de la qualité de la sortie (et de la taille du téléchargement).
- Les voix de la plus haute qualité sont probablement celles disponibles pour Siri, mais elles ne sont malheureusement pas disponibles via l'API Web Speech (problème connexe).
- A l'autre bout du spectre, Apple a eu la malheureuse idée de précharger une large gamme de voix de mauvaise qualité et bizarres comme les packs de voix Eloquence (8 voix) et Effects (15 voix).
- L'existence de ces voix est à elle seule une bonne raison pour filtrer les voix disponibles pour les utilisateurs de macOS et mettre en évidence celles recommandées sur ce dépôt.
- Contrairement à d'autres plates-formes/OS, macOS a décidé de localiser les noms vocaux. Ce ne serait pas un problème si
voiceURI
pouvait être utilisé comme identifiant fiable pour les voix, mais ce n'est pas le cas (problème connexe). - Dans son état actuel, ce référentiel ne documente que les localisations des langues officiellement prises en charge et non des 45 langues prises en charge par le moteur macOS TTS.
Safari
- Pour le meilleur ou pour le pire, le comportement de Safari est généralement cohérent entre ses versions de bureau et mobile.
- Les voix téléchargeables n'apparaissent pas dans la liste renvoyée par l'API Web Speech (problème connexe).
- Pire encore, lors de l'installation de variantes de voix préchargées de meilleure qualité, ces voix disparaissent dans Safari, ce qui signifie que des langues entières pourraient disparaître complètement.
- Toutes les voix renvoient
true
par default
dans Safari, ce qui rend impossible la détection et la sélection de la valeur par défaut du système/utilisateur (problème connexe).
Fenêtres
- Microsoft fournit une page très utile, répertoriant toutes les voix disponibles sur Windows 10 et 11 pour un total de 98 voix dans 36 langues.
- Les voix naturelles offrent une bien meilleure expérience, mais elles nécessitent une version à jour de Windows 11 et doivent être téléchargées (avec l'avantage supplémentaire qu'elles fonctionnent également hors ligne).
- Microsoft a mis du temps à ajouter ces voix naturelles à Windows 11 dans son ensemble. Jusqu'à récemment, seules les voix américaines (3 voix) étaient disponibles. La liste est désormais un peu plus longue (23 voix dans 8 langues) mais reste loin derrière ce qu'ils proposent via Edge (plus de 250 voix dans 75 langues).
- Malheureusement, ces voix de meilleure qualité ne sont actuellement pas correctement répertoriées dans Chrome ou Firefox (problème connexe). Ils n'apparaissent que dans Edge, où ils sont de toute façon préchargés mais strictement pour une utilisation en ligne.