语音处理技术:超低复杂度回声与噪声抑制及半端到端嵌套命名实体识别
在语音处理领域,超低复杂度回声与噪声抑制以及命名实体识别是两个重要的研究方向。下面将为大家详细介绍相关技术的研究进展。
超低复杂度回声与噪声抑制
在回声与噪声抑制的研究中,为了设计适用于高效需求的声学回声消除(AEC)系统的超低复杂度残差回声和噪声抑制(RES)网络,研究人员对 RNNoise 模型进行了扩展,并提出了一组基于循环神经网络(RNN)的 RES 拓扑结构。这些模型使用不同形式的输入,包括远端信号、麦克风信号、预测线性回声和残差误差的不同组合。
代码执行与实时因子
对图 2(c) 拓扑的非向量化 C/C++ 代码在 Intel(R) Core(TM) i5 - 10210U CPU@1.60 GHz 上执行,实时因子(RTF)为 0.014,包含快速傅里叶变换(FFT)/逆快速傅里叶变换(IFFT)和网络推理。而向量化(X86 SSE2 内在函数)代码的 RTF 更低,为 0.008,能够在从低到高配置的 PC 或移动设备上平稳运行。
性能评估
-
AECMOS 得分 :从表 2 可以看出,采用图 2(c) 拓扑,Input1 使用
[[Fd, Fe, Fx, FOy]],Input2 使用Fˆy,Input3 使用Fe时,AECMOS 得分在单讲和双讲场景下均优于基线模型,且标准偏差最小,性能更稳定,因此将该拓扑作为后续比较的默认模型。
| Model | Input1
超级会员免费看
订阅专栏 解锁全文

3659

被折叠的 条评论
为什么被折叠?



