Das Unternehmen für künstliche Intelligenz, Cartesia, hat ein Sprachkonvertierungsmodell namens Voice Changer herausgebracht, das Sprache konvertieren und dabei die Intonation und den Akzent der Originalstimme sowie andere Ausdrucksmerkmale beibehalten kann. Diese Technologie ist auf dem Markt relativ selten. Im Gegensatz zu herkömmlichen Sprachkonvertierungstools, die dazu neigen, die Tonänderungen des Sprechers zu verlieren, was dazu führt, dass die konvertierte Stimme mechanischer klingt, legt der Voice Changer von Cartesia mehr Wert auf die Wiederherstellung der Emotionen und des Tons des Sprechers und behält gleichzeitig die Stimmkonvertierung bei, wodurch der Realismus und die Natürlichkeit der Sprachkonvertierung erheblich verbessert werden werden verbessert. Der Herausgeber von Downcodes führt Sie zu einem detaillierten Verständnis dieses neuen Modells.
Das auf künstliche Intelligenz spezialisierte Unternehmen Cartesia hat kürzlich ein Sprachkonvertierungsmodell namens Voice Changer auf den Markt gebracht. Im Gegensatz zur herkömmlichen Sprachkonvertierung kann dieses Modell nicht nur die eingegebene Sprache in den Zielton umwandeln, sondern auch die Intonation, Betonung und andere Ausdrucksmerkmale des Originaltons beibehalten.
Laut Vertretern von Cartesia können Benutzer diese Funktion auf der Website play.cartesia.ai ausprobieren. Derzeit hat das Unternehmen relevante API-Dokumente veröffentlicht und Entwickler können detaillierte Anweisungen unter docs.cartesia.ai einsehen.
Der Reporter stellte fest, dass diese Art von Konvertierungstechnologie, die die Stimmeigenschaften beibehält, auf dem Markt nicht üblich ist. Die meisten vorhandenen Tools neigen dazu, beim Konvertieren einer Stimme den Tonfall des Sprechers zu verlieren, was dazu führt, dass die konvertierte Stimme roboterhaft klingt.
Cartesia beschreibt in seinem Blog, wie diese Technologie implementiert wird. Das Unternehmen hat jedoch noch nicht auf die ethischen Probleme reagiert, die diese Technologie mit sich bringen kann, wie beispielsweise die unbefugte Nachahmung der Stimmen anderer Personen.
Das Aufkommen des Voice Changer-Modells hat zu neuen Durchbrüchen in der Sprachkonvertierungstechnologie geführt, aber auch ethische Bedenken geweckt. Es besteht die Hoffnung, dass Cartesia in Zukunft eingehendere Untersuchungen und Diskussionen zu diesen potenziellen Risiken durchführen kann, um eine sinnvolle Anwendung der Technologie sicherzustellen. Der Herausgeber von Downcodes wird der weiteren Entwicklung dieser Technologie weiterhin Aufmerksamkeit schenken.