初探 spleeter 的人声分离

本文详细记录了使用Spleeter进行人声分离的过程,包括安装配置、问题解决及测试效果。Spleeter是一款开源AI工具,能够快速分离歌曲中的人声和伴奏音乐。

记录一次试用 spleeter 实现的人声分离。

安装 spleeter

安装 conda

这里仅记录以 linux 安装 conda:

https://conda.io/projects/conda/en/latest/user-guide/install/linux.html

升级 conda

conda update conda

按步骤安装 spleeter 并测试效果

# install using conda
conda install -c conda-forge spleeter

# separate the example audio into two components
spleeter separate -i audio_example.mp3 -p spleeter:2stems -o output

测试人声分离

命令:

spleeter separate -i audio_example.wav -o output

结果是下载「https://github.com/deezer/spleeter/releases/download/v1.4.0/2stems.tar.gz」,等待了很久未下载成功,取消复制网址手动下载下来压缩包,需要放到文件夹 pretrained_mode/2stems 下,并且解压。未解压开始测试会报错:

ValueError: Can’t load save_path when it is None.

解压后即可正常测试。分离完成后在文件夹 output/audio_example/ 下生成了 accompaniment.wavvocals.wav 两个文件。

参考

github: spleeter
Spleeter — 可快速分离歌曲中人声和伴奏音乐的开源AI工具
ffmpeg音视频文件音视频流抽取,初步尝试人声分离

资源下载链接为: https://pan.quark.cn/s/2f7c1c4db4a5 在音乐制作与音频处理领域,人声分离技术极为关键,它可将音乐中的人声与背景音乐分开,为混音、编辑及创意创作带来诸多便利。Spleeter是Deezer Research开发的一款高效人声分离工具,尤其在2-stem模式下,能高质量分离人声和伴奏。本文将深入剖析Spleeter模型,并介绍其在Windows和Ubuntu 18.04系统上的搭建与运行方法。 Spleeter采用深度学习技术,基于TensorFlow框架构建多通道去混合模型。该模型经大量音乐样本训练,可识别并分离人声、鼓声及乐器声音等不同音频成分。其提供的“2stems.tar.gz”压缩包中包含训练好的模型文件,如._checkpoint、checkpoint、model.data-00000-of-00001、model.index和model.meta等,这些文件是模型权重和元数据,用于恢复模型运行状态。 在Windows或Ubuntu 18.04系统上部署Spleeter,需完成以下步骤:一是环境准备,确保系统已安装Python 3.x和pip,通过命令行运行pip install spleeter tensorflow安装TensorFlow、spleeter及相关依赖库(如ffmpeg)。二是模型下载,鉴于从GitHub下载可能较慢,可从提供的压缩包中提取模型文件至本地,确保所有文件在同一目录下。三是分离操作,安装完成后,使用spleeter命令行工具进行人声分离。例如,分离名为“input.mp3”的音乐文件为人声和伴奏,可运行spleeter separate -i input.mp3 -o output -p spleeter:2stems,分离后的人声和伴奏文件将生成于“output”目录下。四是进阶使用
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值