تضافرت جهود Adobe Research وجامعة Northwestern لإنشاء نظام ذكاء اصطناعي ثوري - Sketch2Sound. يمكن لهذا النظام تحويل التقليد الصوتي البسيط ووصف النص إلى مؤثرات صوتية احترافية، مما يؤدي إلى تحسينات غير مسبوقة في الكفاءة في صناعة تصميم الصوت. فهو يقوم بتحليل جهارة الصوت وجرسه ونبرة الكلام ويجمعها مع الأوصاف النصية لإنشاء المؤثرات الصوتية التي يرغب فيها المستخدم. إن قدرته الفريدة على فهم السياق أكثر إثارة للدهشة، على سبيل المثال، من خلال الجمع بين "جو الغابة" البسيط وتقليد نداءات الطيور، يمكن للنظام إنشاء نداءات الطيور الواقعية تلقائيًا دون تعليمات إضافية. يدعم Sketch2Sound أيضًا إنشاء الموسيقى، ويحتاج المستخدمون فقط إلى دندنة الإيقاع وإدخال اسم الآلة، وسيقوم النظام تلقائيًا بمطابقة طبقة الصوت والإيقاع وإنشاء نمط الطبل المقابل.
يقوم النظام بتحليل ثلاثة عناصر رئيسية لإدخال الكلام: جهارة الصوت والجرس (الذي يحدد مدى سطوع الصوت) وطبقة الصوت. يقوم النظام بعد ذلك بدمج هذه الميزات مع وصف نصي لتوليد الصوت المطلوب.
فيديو: غارسيا وآخرون، Adobe Research
الشيء المثير للاهتمام في Sketch2Sound هو قدرته على فهم السياق. على سبيل المثال، إذا كتب شخص ما "أجواء الغابة" وأصدر أصواتًا قصيرة، يتعرف النظام تلقائيًا على أن هذه الأصوات يجب أن تكون نداءات طيور - دون الحاجة إلى تعليمات محددة.
وينطبق نفس الذكاء على الموسيقى. عند إنشاء نمط طبل، يمكن للمستخدمين إدخال "طبل الجهير، طبلة كمين" ثم دندنة الإيقاع باستخدام الجهير والطبل الثلاثي. يقوم النظام تلقائيًا بوضع أسطوانة الجهير على الطرف المنخفض والطبلة على الطرف العلوي.
يوفر للمحترفين التحكم الدقيققام فريق البحث ببناء تقنية تصفية خاصة تسمح للمستخدمين بضبط دقة الأصوات الناتجة والتحكم فيها. يمكن لمصممي الصوت اختيار تحكم دقيق ومفصل أو أسلوب تقريبي أكثر استرخاءً، وفقًا لاحتياجاتهم.
هذه المرونة تجعل Sketch2Sound ذا قيمة خاصة لفناني فولي (المحترفين الذين يقومون بإنشاء مؤثرات صوتية للأفلام والبرامج التلفزيونية). فبدلاً من التلاعب بالأشياء المادية لإصدار الأصوات، يمكنهم إنشاء تأثيرات بشكل أسرع من خلال وصف الكلام والنص.
لاحظ الباحثون أن الخصائص الصوتية المكانية لتسجيل الإدخال يمكن أن تؤثر أحيانًا على الصوت الناتج بطرق غير مرغوب فيها، لكنهم يعملون على معالجة هذه المشكلة. لم تعلن Adobe متى أو ما إذا كان Sketch2Sound سيصبح منتجًا تجاريًا.
لا شك أن ظهور Sketch2Sound سيؤدي إلى تحسين كفاءة تصميم الصوت وملاءمته بشكل كبير، وسيجلب إمكانيات إبداعية جديدة للسينما والتلفزيون والألعاب وغيرها من الصناعات. وعلى الرغم من أنها لا تزال في مرحلة البحث والتطوير، إلا أنه لا يمكن تجاهل إمكاناتها، كما أن تطويرها المستقبلي يستحق التطلع إليه.