Hume AI a annoncé le lancement de sa fonctionnalité expérimentale « Voice Control », une fonctionnalité innovante qui permet aux utilisateurs de personnaliser facilement des voix d'IA personnalisées sans aucune programmation ni expertise en IA. Grâce à des curseurs virtuels intuitifs, les utilisateurs peuvent ajuster avec précision dix dimensions différentes des caractéristiques vocales, telles que le sexe, la confiance, l'enthousiasme, etc., pour créer une voix unique adaptée à divers scénarios d'application. Cette fonctionnalité s’appuie sur « Empathic Voice Interface 2 » (EVI2) précédemment lancée par Hume, améliorant encore le naturel, l’expression émotionnelle et la personnalisation de la parole.
Hume AI, une startup spécialisée dans les interfaces vocales émotionnellement intelligentes, a récemment lancé une fonctionnalité expérimentale appelée « commande vocale ».
Ce nouvel outil est conçu pour aider les développeurs et les utilisateurs à créer des sons d’IA personnalisés sans aucune compétence en matière de codage, d’ingénierie d’invite d’IA ou de conception sonore. Les utilisateurs peuvent facilement personnaliser le son en fonction de leurs besoins en ajustant précisément les caractéristiques sonores.
Cette nouvelle fonctionnalité s’appuie sur l’Empathic Voice Interface 2 (EVI2) précédemment lancée par la société, qui améliore le naturel, la réactivité émotionnelle et la personnalisation de la parole. Contrairement à la technologie traditionnelle de clonage vocal, les produits Hume se concentrent sur la fourniture de voix uniques et expressives pour répondre aux besoins d'une variété d'applications, notamment les chatbots du service client, les assistants numériques, les enseignants, les guides touristiques et les fonctionnalités d'accessibilité.
La commande vocale permet aux développeurs d'ajuster les caractéristiques vocales selon dix dimensions différentes, notamment le sexe, l'affirmation de soi, l'enthousiasme, la confiance, etc.
« Homme/Femme : vocalisations genrées qui varient entre plus masculines et plus féminines.
Confiance : La fermeté de la voix, entre timidité et audace.
Flottabilité : La densité du son, comprise entre la déflation et la flottabilité.
Confiance : Le degré de certitude dans la voix, entre timidité et confiance.
Enthousiasme : Excitation dans la voix, entre calme et enthousiasme.
Nasal : L’ouverture de la voix, allant du clair au nasal.
Relaxation : La pression dans la voix, entre tension et détente.
Douceur : La texture du son, entre douceur et staccato.
Douceur : L'énergie derrière le son, entre douceur et puissance.
Étanchéité : dans quelle mesure le son est contenu, allant de serré à essoufflé. "
Les utilisateurs peuvent affiner ces propriétés en temps réel via des curseurs virtuels, rendant la personnalisation simple et directe. Cette fonctionnalité est actuellement disponible sur la plateforme virtuelle de Hume et les utilisateurs peuvent y accéder en s'inscrivant simplement gratuitement.
La commande vocale est actuellement disponible en version bêta et s'intègre à l'interface vocale empathique (EVI) de Hume, ce qui la rend disponible pour un large éventail d'applications. Les développeurs peuvent sélectionner une voix de base, ajuster ses caractéristiques et prévisualiser les résultats en temps réel. Ce processus garantit la répétabilité et la stabilité d'une session à l'autre, ce qui constitue une caractéristique clé des applications en temps réel telles que les robots du service client ou les assistants virtuels.
L'impact de l'EVI2 est évident dans la fonctionnalité de commande vocale. Les premiers modèles ont introduit des fonctionnalités telles que des invites conversationnelles et des capacités multilingues qui ont élargi la portée des applications d'IA vocale. Par exemple, EVI2 prend en charge des temps de réponse inférieurs à la seconde pour des conversations naturelles et instantanées. Il permet également d’ajuster dynamiquement les styles de parole lors des interactions, ce qui en fait un outil polyvalent pour les entreprises.
Cette décision vise précisément à résoudre le problème de la dépendance aux sons prédéfinis dans l'industrie de l'IA. De nombreuses marques ou applications ont souvent du mal à trouver des sons qui répondent à leurs besoins. L'objectif de Hume est de développer une IA vocale émotionnellement sensible et de promouvoir le progrès de l'industrie. Lorsque EVI2 sortira en septembre 2024, il améliorera déjà considérablement la latence et la rentabilité de la voix et offrira une alternative sécurisée aux fonctions de réglage de la voix.
L'approche axée sur la recherche de Hume est au cœur du développement de produits, combinant des enregistrements vocaux interculturels et des données d'enquête émotionnelles. Cette méthodologie constitue la base d'EVI2 et de la nouvelle commande vocale, lui permettant de capturer la perception humaine du son dans les moindres détails.
Actuellement, la commande vocale a été lancée dans la version bêta et est combinée avec l'interface vocale empathique (EVI) de Hume pour prendre en charge une variété de scénarios d'application. Les développeurs peuvent sélectionner un son de base, ajuster ses caractéristiques et prévisualiser les résultats en temps réel, garantissant ainsi la cohérence et la stabilité dans les applications en temps réel telles que le service client ou les assistants virtuels.
Alors que la concurrence s'intensifie sur le marché, le positionnement personnalisé de Hume en matière de voix et d'intelligence émotionnelle lui permet de se démarquer dans le domaine de l'IA vocale. À l'avenir, Hume prévoit d'étendre les fonctions de commande vocale, d'ajouter des dimensions réglables, d'optimiser la qualité sonore et d'augmenter la sélection de sons de base.
Blog officiel : https://www.hume.ai/blog/introducing-voice-control
Points forts:
? **Hume AI a lancé une fonction « commande vocale », permettant aux utilisateurs de créer facilement des voix d'IA personnalisées. **
?️ ** Cette fonctionnalité ne nécessite aucune compétence en codage et les utilisateurs peuvent ajuster les caractéristiques sonores via des curseurs. **
? **Hume est conçu pour répondre à divers besoins d'applications grâce à une IA vocale personnalisée et émotionnellement intelligente. **
Dans l'ensemble, la fonction « commande vocale » de Hume AI apporte une commodité sans précédent à la personnalisation de la voix de l'IA. Ses fonctionnalités de personnalisation et d'intelligence émotionnelle élargiront considérablement l'application de la voix de l'IA dans divers domaines. .