语音识别
文章平均质量分 80
qq_41627642
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
DeLoRes——一种通用的音频表征学习新方法(DeLoRes(基于 Barlow Twins 的冗余最小化方法)
受计算机视觉领域自监督学习最新进展的启发,本文提出了 DeLoRes——一种通用的音频表征学习新方法。我们的主要目标是在资源受限(包括数据和计算资源)的条件下,使网络学习到能够泛化至多种下游任务的音频表征。受 Barlow Twins 目标函数的启发,我们。。我们在自监督学习阶段仅使用了大规模 AudioSet 数据集的一个小子集以及 FSD50K 数据集,所用模型参数量不到当前最先进算法的一半。原创 2026-02-25 18:39:03 · 1097 阅读 · 0 评论 -
通用音频表征的对比学习
我们提出了 COLA,一种用于学习通用音频表征的自监督预训练方法。。我们在计算机视觉和强化学习领域近期对比学习进展的基础上,设计了一种轻量级、易于实现的音频自监督模型。我们在大规模 AudioSet 数据库上对嵌入向量进行预训练,并将这些表征迁移到 9 个多样化的分类任务中,包括语音、音乐、动物声音和声学场景等。实验表明,尽管我们的方法结构简单,但其性能显著优于以往的自监督系统。此外,我们还进行了消融研究,以识别关键的设计选择,并开源了一个库¹,用于 COLA 模型的预训练与微调。原创 2026-02-25 11:29:42 · 1355 阅读 · 0 评论 -
用于说话人验证与说话人日志的通道对抗训练
以往的研究通过对抗性地分类生成特征所属的数据集或标注环境,以鼓励深度说话人嵌入具有域不变性。本文提出一种训练策略,旨在使特征在录音或通道粒度上保持不变——这一目标比数据集或环境不变性更为精细。。通过这种方式,所学特征将被抑制利用可能具有说话人判别性的通道信息。在VoxCeleb上的验证实验以及在CALLHOME上的日志与验证实验均表明,该方法相较于强基线模型取得了显著提升,并优于基于数据集的对抗模型。原创 2026-01-25 16:11:53 · 713 阅读 · 0 评论 -
基于动量的对抗训练方法用于水下声学目标识别中的泛化能力提升:以单船视角出发
水下被动声学识别(UATR)专注于根据船舶辐射噪声对目标进行分类,是水下声学领域的一项关键挑战。近年来,基于深度学习的方法因其强大的性能而广受欢迎。然而,这些方法在现实场景中往往泛化能力较差。本研究揭示了其中的一个根本性挑战:船舶辐射噪声的特性受到诸如船体结构和推进系统等因素的影响。尽管同类型船舶在这些方面可能表现出不同的模式,但不同类型船舶之间却可能存在相似之处。因此,数据驱动模型往往会过度强调个体特异性特征,从而导致“过拟合”和泛化能力差的问题。原创 2026-01-12 17:46:06 · 797 阅读 · 0 评论 -
EAT: Self-Supervised Pre-Training with Efficient Audio Transformer论文阅读
自监督学习(SSL)已成为音频表示学习的关键方法,其灵感来源于自然语言处理 [Devlin et al., 2018;Radford et al., 2018]、计算机视觉 [Chen et al., 2020;He et al., 2020] 以及语音处理 [Hsu et al., 2021;Ma et al., 2023] 中的成功经验。SSL 的优势在于能够利用海量未标注数据,使模型有效学习数据特征。,这两种方法因其从输入数据中提取丰富特征的能力而备受推崇。原创 2025-12-21 18:11:39 · 1172 阅读 · 0 评论 -
Linux源码安装FFmpeg和av库
下面是开发的各种版本源码下面是发布的稳定版本。原创 2025-11-04 11:46:23 · 524 阅读 · 0 评论 -
LOFAR物理频谱特征提取及实现
LOFAR 频谱以能够描绘低频线谱而闻名,对于识别水下声学目标尤其有用 [26,27]。提取 LOFAR 频谱的主要流程可概括如下。原创 2025-10-17 11:06:44 · 1459 阅读 · 0 评论 -
基于人工智能的水下声学目标识别:综述
水下声学目标识别在海洋遥感中一直占有举足轻重的地位。通过分析和处理船舶辐射的声信号,可以判定目标的类型与性质。传统上,水下环境中的目标识别多依赖信号处理方法,但这些方法在精度与效率上常存在局限。为了解决这些问题,近年来将人工智能(AI)方法,尤其是基于机器学习与深度学习的方法,逐步引入该领域并受到广泛关注。与传统方法相比,智能识别技术能够自主地、高效地并且更准确地识别水下目标。原创 2025-09-26 15:05:58 · 1492 阅读 · 0 评论
分享