ElevenLabs, une startup spécialisée dans le clonage vocal de l'IA et l'API de synthèse vocale, a récemment lancé une nouvelle fonctionnalité : les utilisateurs peuvent créer indépendamment des agents d'IA conversationnels complets. Cette nouvelle fonctionnalité permet aux utilisateurs de personnaliser de nombreux paramètres de l'agent conversationnel en fonction de leurs propres besoins sur la plateforme de développement ElevenLabs, comme l'intonation de la voix, la longueur de la réponse, etc., ce qui améliore grandement la personnalisation et la praticité de l'agent IA. Cette décision simplifie non seulement le processus de création de robots conversationnels, mais fournit également aux développeurs des outils plus flexibles et plus puissants pour répondre à divers scénarios d'application.
ElevenLabs, une startup spécialisée dans le clonage vocal de l'IA et l'API de synthèse vocale, a récemment annoncé le lancement de nouvelles fonctionnalités permettant aux utilisateurs de créer des agents d'IA conversationnels complets.
Les utilisateurs peuvent désormais personnaliser diverses variables de l'agent conversationnel en fonction de leurs propres besoins sur la plateforme de développement ElevenLabs, telles que l'intonation de la voix et la longueur de la réponse.
ElevenLabs a principalement fourni différents services de parole et de synthèse vocale dans le passé. Sam Sklar, responsable de la croissance de l'entreprise, a déclaré à TechCrunch que de nombreux clients utilisent déjà la plateforme pour créer des agents d'IA conversationnels. Mais l’intégration de la base de connaissances et la gestion des pannes clients constituent les plus grands défis. ElevenLabs a donc décidé de créer un pipeline de robots conversationnels complet pour faciliter ce processus.
Les utilisateurs peuvent commencer à créer des agents conversationnels en se connectant à leur compte ElevenLabs, en sélectionnant un modèle ou en créant un nouveau projet. Ils peuvent sélectionner la langue principale de l'agent, le premier message et les invites du système pour déterminer la personnalité de l'agent.
De plus, les développeurs doivent choisir un modèle de langage étendu (tel que Gemini, GPT ou Claude), la température de la réponse (détermine la créativité) et les restrictions d'utilisation des jetons.
Les utilisateurs peuvent également ajouter des bases de connaissances telles que des fichiers, des URL ou des blocs de texte en fonction de leurs besoins pour améliorer les capacités du robot conversationnel. Dans le même temps, ils peuvent intégrer leurs propres grands modèles de langage personnalisés au bot. Le SDK d'ElevenLabs est compatible avec Python, JavaScript, React et Swift, et la société fournit également une API WebSocket pour une personnalisation plus poussée.
L'entreprise permet également aux utilisateurs de définir des critères de collecte de données, tels que le nom et l'e-mail du client qui a parlé à l'agent, et d'utiliser le langage naturel pour définir des critères d'évaluation du succès de l'appel.
ElevenLabs exploite son pipeline de synthèse vocale existant tout en développant également des capacités de synthèse vocale pour les nouveaux produits d'IA conversationnelle. Actuellement, la société ne propose pas d'API de synthèse vocale distincte, mais elle pourrait la lancer à l'avenir, rivalisant ainsi avec les API de synthèse vocale d'entreprises telles que Google, Microsoft et Amazon, ainsi qu'avec Les API Whisper, AssemblyAI, Deepgram, Speechmatics et Gladia d'OpenAI sont en concurrence.
La société prévoit de lever une nouvelle levée de fonds pour une valorisation de plus de 3 milliards de dollars et est en concurrence avec d'autres startups d'IA vocale telles que Vapi et Retell, qui construisent également des agents conversationnels. De plus, ElevenLabs concurrencera l'API de conversation en temps réel d'OpenAI. Cependant, ElevenLabs estime que sa capacité de personnalisation et sa flexibilité de changer de modèle lui donneront un avantage sur la concurrence.
Souligner:
ElevenLabs a lancé une nouvelle fonctionnalité pour créer des agents d'IA conversationnels qui permettent aux utilisateurs de personnaliser plusieurs variables.
Les utilisateurs peuvent ajouter des bases de connaissances pour améliorer les capacités des agents et y intégrer des modèles de langage étendus personnalisés.
ElevenLabs prévoit de lever des fonds pour une valeur de plus de 3 milliards de dollars et de rivaliser avec des concurrents tels qu'OpenAI.
Dans l’ensemble, les nouvelles capacités d’ElevenLabs offrent une flexibilité et une commodité sans précédent pour créer des agents d’IA conversationnels personnalisés, ce qui la propulsera vers une position plus favorable sur le marché hautement concurrentiel de l’IA. À l’avenir, le développement d’ElevenLabs mérite une attention continue.