Demucs前篇1:Wave-U-Net

Demucs结合了SING和Wave-U-Net的优势,采用largestride、largechannel、LSTM及conv特性,保留Wave-U-Net的U-Net结构。通过差值输出层实现sourcek=mix-∑其他,确保所有源信号之和等于混合信号。文章对比了waveform与spectrum的优劣,提出一种利用waveform的baseline,并深入探讨了实现细节。
AI助手已提取文章相关产品:

Demucs是说各用了SING和Wave-U-Net的一部分结构。
用了SING的large stride和large channel、LSTM以及conv,但是保持了Wave-U-Net的U-Net。
waveunet
这里有个差值输出层,是说第k个source是mix和其他k-1个source的差值。所以前k-1个source由网络得到,sourcek = mix-∑其他,确保∑所有=mixture

一直在疯狂的downsampling block和upsampling block,L=12,DB的输出还会直接concat在对应层的UB上,包括input也会在k个source之前concat在输出上,然后再经过一个conv(K,1)。
baseline of waveunet

文章提出了wave form的好处,先diss了一番spectrum的没有利用到phase info,分离的时候只用了amplitude info但是最后用的是mixture的phase info。但是呢,wave form因为采样频率一般比较高,没法利用context信息。

先是提出了一个baseline,然后再具体了某些实现细节,也算是ablation study,包括:

  • 差值输出层
  • 边界值(diss zero padding不好,分段处理之后边界不是真正的context,拼接的时候会有不连续的感觉)
  • 多轨道
  • 学习插值

您可能感兴趣的与本文相关内容

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值