復譜映射下融合高效Transformer的語音增強方法
信號處理
頁數(shù): 11 2024-02-25
摘要: 針對卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network, CNN)過去在語音增強中表現(xiàn)優(yōu)異但對全局特征捕獲不足,以及Transformer近年展現(xiàn)出長序列間依賴優(yōu)勢但又存在局部細節(jié)特征丟失、參數(shù)量大等問題,該文為了充分利用CNN與Transformer的優(yōu)勢并彌補各自不足,提出了一種在復頻譜映射下的新型卷積模塊與高效Transformer融合的單通道語音增強...