أعلنت شركة Hume AI عن إطلاق ميزتها التجريبية "Voice Control"، وهي ميزة مبتكرة تتيح للمستخدمين تخصيص أصوات الذكاء الاصطناعي المخصصة بسهولة دون أي برمجة أو خبرة في الذكاء الاصطناعي. من خلال أشرطة التمرير الافتراضية البديهية، يمكن للمستخدمين ضبط عشرة أبعاد مختلفة لخصائص الصوت بدقة، مثل الجنس والثقة والحماس وما إلى ذلك، لإنشاء صوت فريد يناسب سيناريوهات التطبيق المختلفة. تعتمد هذه الميزة على "Empathic Voice Interface 2" (EVI2) التي أطلقها هيوم سابقًا، مما يعمل على تحسين الطبيعة والتعبير العاطفي وقابلية تخصيص الكلام.
أطلقت شركة Hume AI، وهي شركة ناشئة تركز على الواجهات الصوتية الذكية عاطفيًا، مؤخرًا ميزة تجريبية تسمى "التحكم الصوتي".
تم تصميم هذه الأداة الجديدة لمساعدة المطورين والمستخدمين على إنشاء أصوات مخصصة للذكاء الاصطناعي دون أي مهارات في البرمجة أو هندسة الذكاء الاصطناعي أو مهارات تصميم الصوت. يمكن للمستخدمين تخصيص الصوت بسهولة ليناسب احتياجاتهم من خلال ضبط خصائص الصوت بدقة.
تعتمد هذه الميزة الجديدة على واجهة Empathic Voice Interface 2 (EVI2) التي أطلقتها الشركة سابقًا، والتي تعمل على تعزيز الطبيعة والاستجابة العاطفية وقابلية تخصيص الكلام. على عكس تكنولوجيا الاستنساخ الصوتي التقليدية، تركز منتجات هيوم على تقديم أصوات فريدة ومعبرة لتلبية احتياجات مجموعة متنوعة من التطبيقات بما في ذلك روبوتات الدردشة لخدمة العملاء والمساعدين الرقميين والمدرسين والمرشدين السياحيين وميزات إمكانية الوصول.
يسمح التحكم الصوتي للمطورين بضبط خصائص الصوت عبر عشرة أبعاد مختلفة، بما في ذلك الجنس والتأكيد والإثارة والثقة والمزيد.
"ذكر / أنثى: الألفاظ المرتبطة بالجنس والتي تتراوح بين أكثر ذكورية وأكثر أنثوية.
الثقة: صلابة الصوت، بين الخجل والجرأة.
الطفو: كثافة الصوت التي تتراوح بين الانكماش والطفو.
الثقة: درجة اليقين في الصوت، بين الخجل والثقة.
الحماس: إثارة في الصوت، في مكان ما بين الهدوء والحماس.
الأنف: جهار الصوت، الذي يتراوح بين الواضح والأنفي.
الاسترخاء: ضغط في الصوت، بين التوتر والاسترخاء.
السلاسة: نوعية الصوت، وهي في مكان ما بين السلس والمتقطع.
اللطف: الطاقة الكامنة وراء الصوت، في مكان ما بين اللطيف والقوي.
الضيق: مدى احتواء الصوت، ويتراوح بين الضيق وعدم التنفس. "
يمكن للمستخدمين ضبط هذه الخصائص في الوقت الفعلي عبر أشرطة التمرير الافتراضية، مما يجعل التخصيص بسيطًا ومباشرًا. هذه الميزة متاحة حاليًا في منصة Hume الافتراضية، ويمكن للمستخدمين الوصول إليها بمجرد التسجيل مجانًا.
يتوفر التحكم الصوتي حاليًا في إصدار تجريبي ويتكامل مع واجهة الصوت التعاطفي (EVI) الخاصة بـ Hume، مما يجعله متاحًا لمجموعة واسعة من التطبيقات. يمكن للمطورين اختيار الصوت الأساسي وضبط خصائصه ومعاينة النتائج في الوقت الفعلي. تضمن هذه العملية التكرار والاستقرار من جلسة إلى أخرى، وهي سمة أساسية لتطبيقات الوقت الفعلي مثل روبوتات خدمة العملاء أو المساعدين الافتراضيين.
ويتجلى تأثير EVI2 في وظيفة التحكم الصوتي. قدمت النماذج المبكرة ميزات مثل المطالبات المحادثة وإمكانيات متعددة اللغات التي وسعت نطاق تطبيقات الذكاء الاصطناعي الصوتي. على سبيل المثال، يدعم EVI2 أوقات استجابة أقل من ثانية للمحادثات الطبيعية والفورية. كما يسمح أيضًا بتعديل أساليب التحدث ديناميكيًا أثناء التفاعلات، مما يجعله أداة متعددة الاستخدامات للشركات.
تهدف هذه الخطوة على وجه التحديد إلى حل مشكلة الاعتماد على الأصوات المحددة مسبقًا في صناعة الذكاء الاصطناعي غالبًا ما تواجه العديد من العلامات التجارية أو التطبيقات صعوبة في العثور على الأصوات التي تلبي احتياجاتها. هدف هيوم هو تطوير الذكاء الاصطناعي الصوتي الحساس عاطفياً وتعزيز تقدم الصناعة. عندما يتم إصدار EVI2 في سبتمبر 2024، فإنه سيعمل بالفعل على تحسين زمن الوصول وفعالية التكلفة للصوت بشكل كبير ويوفر بديلاً آمنًا لوظائف ضبط الصوت.
يقع منهج هيوم القائم على الأبحاث في قلب تطوير المنتجات، حيث يجمع بين التسجيلات الصوتية عبر الثقافات وبيانات المسح العاطفي. تشكل هذه المنهجية أساس EVI2 والتحكم الصوتي الذي تم إطلاقه حديثًا، مما يسمح له بالتقاط الإدراك البشري للصوت بتفاصيل دقيقة.
حاليًا، تم إطلاق التحكم الصوتي في الإصدار التجريبي وتم دمجه مع واجهة الصوت التعاطفي (EVI) الخاصة بـ Hume لدعم مجموعة متنوعة من سيناريوهات التطبيق. يمكن للمطورين اختيار الصوت الأساسي وضبط خصائصه ومعاينة النتائج في الوقت الفعلي، مما يضمن الاتساق والاستقرار في التطبيقات في الوقت الفعلي مثل خدمة العملاء أو المساعدين الافتراضيين.
مع اشتداد المنافسة في السوق، فإن صوت هيوم الشخصي وموقع الذكاء العاطفي يجعله متميزًا في مجال الذكاء الاصطناعي الصوتي. في المستقبل، يخطط هيوم لتوسيع وظائف التحكم الصوتي، وإضافة أبعاد قابلة للتعديل، وتحسين جودة الصوت، وزيادة اختيار الأصوات الأساسية.
المدونة الرسمية: https://www.hume.ai/blog/introducing-voice-control
أبرز النقاط:
** أطلقت شركة Hume AI وظيفة "التحكم الصوتي"، مما يسمح للمستخدمين بإنشاء أصوات مخصصة للذكاء الاصطناعي بسهولة. **
️ ** لا تتطلب هذه الميزة أي مهارات برمجية، ويمكن للمستخدمين ضبط خصائص الصوت من خلال أشرطة التمرير. **
** تم تصميم Hume لتلبية احتياجات التطبيقات المتنوعة من خلال الذكاء الاصطناعي الصوتي المخصص والعاطفي. **
بشكل عام، توفر وظيفة "التحكم الصوتي" الخاصة بـ Hume AI راحة غير مسبوقة في تخصيص صوت الذكاء الاصطناعي، وستعمل ميزات التخصيص والذكاء العاطفي على توسيع نطاق تطبيق صوت الذكاء الاصطناعي بشكل كبير في مختلف المجالات .