基于卷积神经网络的语音去噪模型研究
1. 引言
在语音处理领域,同时实现语音去噪和去混响是一个重要的研究方向。研究聚焦于单声道语音增强算法,考虑了提取单个说话者和多个期望说话者的两种场景,并提出了基于卷积神经网络(CNN)的单阶段和两阶段模型,即 GCT - Net 和 CTS - Net,同时采用了单说话者训练集和多说话者训练集两种训练策略。
2. ESTOI 分数分析
2.1 不同模型和训练策略的 ESTOI 分数
| T60 (ms) | One speaker test set - One speaker training set | One speaker test set - Mix - speaker training set | Two speaker test set - One speaker training set | Two speaker test set - Mix - speaker training set |
|---|---|---|---|---|
| 1200 | 30.11 | 54.19 (GCT), 56.91 (CTS) | 27.87 | 44.01 (GCT), 45.13 (CTS) |
| 1000 | 34.24 |
超级会员免费看
订阅专栏 解锁全文

2288

被折叠的 条评论
为什么被折叠?



