ElevenLabs, ein Startup-Unternehmen, das sich auf das Klonen von KI-Stimmen und die Text-to-Speech-API konzentriert, hat kürzlich eine neue Funktion eingeführt: Benutzer können selbstständig komplette Konversations-KI-Agenten erstellen. Mit dieser neuen Funktion können Benutzer viele Parameter des Konversationsagenten auf der ElevenLabs-Entwicklerplattform an ihre eigenen Bedürfnisse anpassen, wie z. B. Stimmton, Antwortlänge usw., was die Anpassung und Praktikabilität des KI-Agenten erheblich verbessert. Dieser Schritt vereinfacht nicht nur den Prozess der Erstellung von Konversations-Bots, sondern bietet Entwicklern auch flexiblere und leistungsfähigere Tools für verschiedene Anwendungsszenarien.
ElevenLabs, ein Startup-Unternehmen, das sich auf das Klonen von KI-Stimmen und die Text-to-Speech-API konzentriert, kündigte kürzlich die Einführung neuer Funktionen an, die es Benutzern ermöglichen, komplette Konversations-KI-Agenten zu erstellen.
Benutzer können nun auf der ElevenLabs-Entwicklerplattform verschiedene Variablen des Konversationsagenten entsprechend ihren eigenen Bedürfnissen anpassen, wie zum Beispiel die Stimmintonation und die Antwortlänge.
ElevenLabs hat in der Vergangenheit vor allem verschiedene Sprach- und Text-to-Speech-Dienste angeboten. Sam Sklar, Wachstumsleiter des Unternehmens, sagte gegenüber TechCrunch, dass viele Kunden die Plattform bereits nutzen, um dialogorientierte KI-Agenten zu erstellen. Doch die Integration der Wissensdatenbank und die Bewältigung von Kundenausfällen sind die größten Herausforderungen. Deshalb hat ElevenLabs beschlossen, eine vollständige Conversational-Bot-Pipeline aufzubauen, um diesen Prozess zu vereinfachen.
Benutzer können mit der Erstellung von Konversationsagenten beginnen, indem sie sich bei ihrem ElevenLabs-Konto anmelden, eine Vorlage auswählen oder ein neues Projekt erstellen. Sie können die primäre Sprache, die erste Nachricht und Systemansagen des Agenten auswählen, um die Persönlichkeit des Agenten zu bestimmen.
Darüber hinaus müssen Entwickler ein großes Sprachmodell (z. B. Gemini, GPT oder Claude), die Antworttemperatur (bestimmt die Kreativität) und Einschränkungen für die Token-Nutzung auswählen.
Benutzer können je nach Bedarf auch Wissensdatenbanken wie Dateien, URLs oder Textblöcke hinzufügen, um die Funktionen des Konversationsbots zu erweitern. Gleichzeitig können sie ihre eigenen benutzerdefinierten großen Sprachmodelle in den Bot integrieren. Das SDK von ElevenLabs ist mit Python, JavaScript, React und Swift kompatibel, und das Unternehmen stellt außerdem eine WebSocket-API für weitere Anpassungen bereit.
Das Unternehmen ermöglicht Benutzern außerdem, Datenerfassungskriterien zu definieren, wie z. B. den Namen und die E-Mail-Adresse des Kunden, der mit dem Agenten gesprochen hat, und mithilfe natürlicher Sprache Kriterien für die Bewertung des Erfolgs des Anrufs zu definieren.
ElevenLabs nutzt seine bestehende Text-to-Speech-Pipeline und entwickelt gleichzeitig Speech-to-Text-Funktionen für neue Konversations-KI-Produkte. Derzeit bietet das Unternehmen keine separate Speech-to-Text-API an, wird diese jedoch möglicherweise in Zukunft einführen und damit mit den Speech-to-Text-APIs von Unternehmen wie Google, Microsoft und Amazon sowie mit konkurrieren Die Whisper-, AssemblyAI-, Deepgram-, Speechmatics- und Gladia-APIs von OpenAI konkurrieren.
Das Unternehmen plant eine neue Finanzierungsrunde mit einem Wert von mehr als 3 Milliarden US-Dollar und konkurriert mit anderen Sprach-KI-Startups wie Vapi und Retell, die ebenfalls Konversationsagenten entwickeln. Darüber hinaus wird ElevenLabs mit der Echtzeit-Konversations-API von OpenAI konkurrieren. Allerdings ist ElevenLabs davon überzeugt, dass ihm seine Anpassungsfähigkeit und die Flexibilität, zwischen Modellen zu wechseln, einen Vorteil gegenüber der Konkurrenz verschaffen werden.
Highlight:
ElevenLabs hat eine neue Funktion zum Erstellen von Konversations-KI-Agenten eingeführt, die es Benutzern ermöglicht, mehrere Variablen anzupassen.
Benutzer können Wissensdatenbanken hinzufügen, um die Agentenfunktionen zu verbessern und benutzerdefinierte große Sprachmodelle in diese zu integrieren.
ElevenLabs plant, Finanzmittel im Wert von mehr als 3 Milliarden US-Dollar aufzubringen und mit Konkurrenten wie OpenAI zu konkurrieren.
Zusammengenommen bieten die neuen Funktionen von ElevenLabs eine beispiellose Flexibilität und Bequemlichkeit für die Entwicklung benutzerdefinierter Konversations-KI-Agenten, was dem Unternehmen eine günstigere Position im hart umkämpften KI-Markt verschaffen wird. Auch in Zukunft verdient die Entwicklung von ElevenLabs weiterhin Aufmerksamkeit.