当前位置 : 主页 > 编程语言 > 其它开发 >

[论文] 基于轴向注意多尺度时频卷积网络的语音增强算法

来源:互联网 收集:自由互联 发布时间:2022-05-20
本文介绍了ICASSP2022 DNS Challenge和AEC Challenge第一名百度的技术方案。该方案提出了一种信号处理-深度学习混合式方法(hybrid method),同时抑制回声、噪声和混响。其中信号处理部分利用线

本文介绍了ICASSP2022 DNS Challenge和AEC Challenge第一名百度的技术方案。该方案提出了一种信号处理-深度学习混合式方法(hybrid method),同时抑制回声、噪声和混响。其中信号处理部分利用线性回声消除算法为深度神经网络提供条件信息(conditional information);而深度学习部分提出了一种语音密集预测网络(speech dense-prediction backbone),其中包括麦克风接收信号和参考信号的相位编码器、多尺度时频处理和流式轴向注意力(axial attention)机制等策略。该系统在ICASSP2022年AEC和DNS挑战赛(非个性化赛道)中均排名第一,并扩展到多通道在ICASSP2022 L3DAS22 Challenge中获得第二名

论文题目:Multi-scale temporal frequency convolutional network with axial attention for speech enhancement

上一篇:有关动态规划的相关优化思想
下一篇:没有了
网友评论