归一化是什么意思
音频领域存在三大问题,即所谓的3A难题:声学回声消除(AEC)、背景噪声抑制(ANS)以及自动增益控制(AGC)。今天,我们将深入探讨其中的声学回声消除技术。
声学回声的产生,通常源于免提或会议应用中,扬声器的声音多次反馈至麦克风。而线路回声则是由物理电子线路的二四线匹配耦合所导致。声学回声消除技术,主要针对的是声学回声问题,其技术核心在于消除声学回音,保证会议场景下声音的清晰度。
当远端讲话者的声音信号传输至近端设备并播放出来后,该声音可能会被近端设备的麦克风拾取并再次传输给远端。这一过程中,近端设备麦克风接收到的信号除了包括原始的远端信号外,还叠加了声学反射后的回声信号。这种回声现象会导致远端讲话者在短时间内听到自己的回声。
使用AEC(声学回声消除)技术后,声音的传输过程得以改变。该技术通过自适应滤波器对远端信号进行处理,获得回声信号,并计算麦克风接收到的信号与该回声信号的差值作为误差。此误差再传递给自适应滤波器,进行滤波器系数迭代更新,从而达到消除回声的效果。
在评估AEC性能时,有多个关键指标如ERLE(回声返回衰减增益)、SupperFactor(能量衰减因子)、Cohde以及Cohxe等。其中,ERLE值越大,表明回声抵消效果越好。而Cohde和Cohxe则分别反映了输出信号与麦克风信号以及远端参考信号的频谱相似性。
针对双讲场景(即近端和远端同时有讲话者),AEC技术需尽量抑制回声同时保留近端语音。为此,自适应滤波器需根据双讲检测结果灵活工作,如远端语音存在而近端语音不存在时,滤波器正常工作并更新系数;而双讲同时存在时,则需采取相应策略以平衡回声消除与语音保留。
为了进一步提高AEC性能,还可以采用多种滤波器结构如Block LMS、Fast Block LMS以及Partitioned Fast Block LMS等。这些结构通过分块处理、快速卷积及FFT助攻等技术手段,大大降低了算法的计算复杂度。
当自适应滤波器性能变差或发散时,双滤波器结构可实现隐式的双讲检测并保证AEC的稳定性。该结构包括一个自适应的Background Filter和一个非自适应的Foreground Filter。当Background Filter性能不佳时,AEC可使用Foreground Filter的结果并重置Background Filter;而当Background Filter性能恢复时,则将其参数下载至Foreground Filter。
为了进一步优化AEC性能,还可以根据当前信号推导出最优步长,并将其应用于滤波器中。对于AEC的输出信号中残留的回声,还可以通过Post-Filter进行残留回声消除。
声学回声消除技术在音频领域具有重要作用。通过深入了解其原理、算法及结构,我们可以更好地应用该技术,提高音频质量及用户体验。
参考资料:
[1] 相关音频处理教材及论文
[2] 声学回声消除技术相关网站及论坛
[3] 实际项目中的声学回声消除应用案例