تطلق Cartesia نموذجًا جديدًا لتحويل الكلام: يمكنه الحفاظ على خصائص نغمة المتحدث

الكاتب：Eve Cole وقت التحديث：2024-11-29 10:12:01

أصدرت شركة الذكاء الاصطناعي Cartesia نموذجًا لتحويل الكلام يسمى Voice Changer، والذي يمكنه تحويل الكلام مع الاحتفاظ بنغمة ولهجة الصوت الأصلي والميزات التعبيرية الأخرى. هذه التكنولوجيا نادرة نسبيًا في السوق. على عكس أدوات تحويل الصوت التقليدية التي تميل إلى فقدان تغييرات نغمة المتحدث، مما يتسبب في أن يبدو الصوت المحول يبدو أكثر ميكانيكية، يولي برنامج Cartesia's Voice Changer المزيد من الاهتمام لاستعادة عاطفة المتحدث ونغمته مع الحفاظ على تحويل الصوت، مما يحسن بشكل كبير واقعية وطبيعية تحويل الكلام تم تحسينها. سيأخذك محرر Downcodes إلى فهم متعمق لهذا النموذج الجديد.

أطلقت شركة الذكاء الاصطناعي Cartesia مؤخرًا نموذجًا لتحويل الكلام يسمى Voice Changer. يختلف هذا النموذج عن تحويل الكلام التقليدي، ولا يمكنه تحويل الكلام المُدخل إلى الصوت المستهدف فحسب، بل يمكنه أيضًا الحفاظ على التنغيم والضغط وخصائص التعبير الأخرى للصوت الأصلي.

وفقًا لمسؤولي Cartesia، يمكن للمستخدمين تجربة هذه الميزة على موقع play.cartesia.ai. في الوقت الحاضر، أصدرت الشركة مستندات واجهة برمجة التطبيقات (API) ذات الصلة، ويمكن للمطورين عرض التعليمات التفصيلية على docs.cartesia.ai.

لاحظ المراسل أن هذا النوع من تكنولوجيا التحويل الذي يحتفظ بخصائص الصوت ليس شائعًا في السوق. تميل معظم الأدوات الموجودة إلى فقدان تصريفات مكبر الصوت عند تحويل الصوت، مما يجعل الصوت المحول يبدو آليًا.

تشرح Cartesia تفاصيل كيفية تطبيق هذه التقنية على مدونتها. ومع ذلك، لم تستجب الشركة بعد للقضايا الأخلاقية التي قد تجلبها هذه التكنولوجيا، مثل التقليد غير المصرح به لأصوات الآخرين.

لقد أدى ظهور نموذج Voice Changer إلى تحقيق اختراقات جديدة في تكنولوجيا تحويل الصوت، ولكنه أثار أيضًا مخاوف بشأن القضايا الأخلاقية. ومن المأمول أن تتمكن كارتيسيا من إجراء المزيد من الأبحاث والمناقشات المتعمقة حول هذه المخاطر المحتملة في المستقبل لضمان التطبيق المعقول للتكنولوجيا. سيستمر محرر Downcodes في الاهتمام بالتطور اللاحق لهذه التقنية.