2、语音处理技术:超低复杂度回声与噪声抑制及半端到端嵌套命名实体识别

语音处理技术:超低复杂度回声与噪声抑制及半端到端嵌套命名实体识别

在语音处理领域,超低复杂度回声与噪声抑制以及命名实体识别是两个重要的研究方向。下面将为大家详细介绍相关技术的研究进展。

超低复杂度回声与噪声抑制

在回声与噪声抑制的研究中,为了设计适用于高效需求的声学回声消除(AEC)系统的超低复杂度残差回声和噪声抑制(RES)网络,研究人员对 RNNoise 模型进行了扩展,并提出了一组基于循环神经网络(RNN)的 RES 拓扑结构。这些模型使用不同形式的输入,包括远端信号、麦克风信号、预测线性回声和残差误差的不同组合。

代码执行与实时因子

对图 2(c) 拓扑的非向量化 C/C++ 代码在 Intel(R) Core(TM) i5 - 10210U CPU@1.60 GHz 上执行,实时因子(RTF)为 0.014,包含快速傅里叶变换(FFT)/逆快速傅里叶变换(IFFT)和网络推理。而向量化(X86 SSE2 内在函数)代码的 RTF 更低,为 0.008,能够在从低到高配置的 PC 或移动设备上平稳运行。

性能评估
  • AECMOS 得分 :从表 2 可以看出,采用图 2(c) 拓扑,Input1 使用 [[Fd, Fe, Fx, FOy]] ,Input2 使用 Fˆy ,Input3 使用 Fe 时,AECMOS 得分在单讲和双讲场景下均优于基线模型,且标准偏差最小,性能更稳定,因此将该拓扑作为后续比较的默认模型。
    | Model | Input1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值