Adobe Research 與西北大學合作,研發出一款名為Sketch2Sound的人工智慧系統,這款AI工具可望革新聲音設計領域。它允許使用者僅透過哼唱、聲音模仿或簡單的文字描述,就能創造出專業的音效和環境音,大大簡化了聲音設計流程,並提升了效率。 Sketch2Sound分析使用者輸入的音量、音色和音高,結合文字描述,聰明地產生所需聲音,例如識別使用者模仿的鳥鳴聲並將其融入「森林氛圍」的音效中。
近日,Adobe Research 與西北大學合作開發了一款名為Sketch2Sound 的人工智慧系統,這項工具有望徹底改變聲音設計師的工作方式。 Sketch2Sound 能夠讓使用者透過哼唱、模仿聲音以及用簡單的文字描述來創造專業的音效和氛圍音。
這個系統分析了使用者聲帶輸入的三個關鍵要素:音量、音色(決定聲音的明亮或陰暗)和音高。隨後,它將這些特徵與使用者的文字描述相結合,從而產生所需的聲音。例如,使用者在輸入「森林氛圍」 並發出短暫的聲響時,系統會自動將這些聲響識別為鳥鳴,而無需特定的指令。
Sketch2Sound 的另一個亮點在於它對上下文的理解能力。在製作音樂時,使用者可以輸入“低音鼓、小鼓”,並透過哼唱出節奏。系統會智慧地將低音鼓放在低音音符上,而小鼓則置於高音音符上。這種智慧化的處理大大簡化了聲音設計的過程。
為了滿足專業人士的需求,研究團隊還內建了特殊的過濾技術,使用戶可以根據需要調整生成聲音的精確度。聲音設計師可以選擇非常準確的控制,或是更放鬆、近似的方式,這種靈活性可能使Sketch2Sound 特別受Foley 藝術家的歡迎。這些專業人士負責為電影和電視節目創作音效,使用這項工具後,他們可以透過聲音和文字描述更快速地創造效果,而不必再操控實物來發聲。
雖然研究人員指出,輸入錄音中的空間音訊特性有時會對產生的聲音產生不良影響,但他們正在努力解決這個問題。目前,Adobe 尚未宣布Sketch2Sound 是否會推出商業產品或具體的發佈時間。
專案入口:https://hugofloresgarcia.art/sketch2sound/
劃重點:
Sketch2Sound 是一個新開發的AI 工具,能透過哼唱和文字描述來創造音效。
系統分析音量、音色和音高,將使用者的聲音輸入與文字結合產生目標音效。
特別適合Foley 藝術家使用,能夠快速產生影視音效,提升工作效率。
總而言之,Sketch2Sound憑藉其智慧化和便利性,有潛力成為聲音設計師和Foley藝術家的得力助手,大幅提升工作效率。雖然目前仍處於研發階段,但其未來發展值得期待。 項目連結已提供,有興趣的用戶可以進一步了解。