Die Technologie für künstliche Intelligenz durchbricht ständig die Grenzen der Innovation, und das Gebiet der Sprachumwandlung hat den großen Fortschritt eingeleitet. Das von Cartesia gestartete Sprachwechslermodell bietet der Branche neue Möglichkeiten mit seiner einzigartigen Aufbewahrungsfähigkeit von Sprachmerkmalen.
Die künstliche Intelligenzfirma Cartesia hat kürzlich ein Sprachkonvertierungsmodell namens "Voice Changer" gestartet. Im Gegensatz zur herkömmlichen Sprachumwandlung kann dieses Modell nicht nur die Eingangsstimme in Zielklang umwandeln, sondern auch die Expressionseigenschaften des Tons, der Spannung und anderer Ausdrücke im ursprünglichen Sound beibehalten.
Laut der offiziellen Einführung von Cartesia können Benutzer diese Funktion auf der Website von Play.cartesia.ai ausprobieren. Das Unternehmen hat relevante API -Dokumente veröffentlicht, und Entwickler können detaillierte Anweisungen über docs.cartesia.ai anzeigen.
Der Reporter bemerkte, dass diese Art von Conversion -Technologie, die Sprachmerkmale beibehält, auf dem Markt nicht üblich ist. Die meisten vorhandenen Tools verlieren die Tonveränderungen des Lautsprechers bei der Konvertierung von Geräuschen, was dazu führt, dass die konvertierten Geräusche mechanischer klingen.
Cartesia beschreibt die spezifische Implementierung der Technologie in ihrem Blog. Das Unternehmen hat jedoch noch nicht auf ethische Probleme reagiert, die durch diese Technologie hervorgerufen werden können, wie beispielsweise die Nachahmung der Stimmen anderer Menschen ohne Genehmigung.
Diese innovative Technologie hat neue Richtungen für den Bereich der Sprachkonvertierung eröffnet, aber auch das Denken der Menschen über die technologische Ethik ausgelöst.