分离音频的人声和背景音/音轨----spleeter

Python3.8

Python3.8

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

介绍

这是一个基于python 语言编写的一个工具类小项目,运用了spleeter 库,分割音频中的人声和背景音,目前测试效果还是比较好,主要是免费的就是香。如果你做自媒体,或者AIGC相关音频项目,相信这是个对你很大帮助的小工具。

开搞

环境:

	python >=3.9   linux  ubantu20.04,其他系统请自行灵活应变

1:安装必要组件

	apt install ffmpeg
	pip install spleeter

2:创建spleeter项目环境

	1:在你自己喜欢的目录下创建spleeter文件夹
	
		mkdir spleeter && cd spleeter
		
	2:在spleeter下创建raw文件夹以备用,创建pretrained_models 模型文件夹
		
		mkdir raw
		mkdir pretrained_models
	
	3:下载模型到spleeter下的 pretrained_models 文件夹内
		
		wget -P pretrained_models https://github.com/deezer/spleeter/releases/download/v1.4.0/2stems.tar.gz
	
	4:把模型解压到  pretrained_models  文件夹下的 2stems 文件夹内
	
		mkdir -p pretrained_models/2stems
		tar -zxvf pretrained_models/2stems.tar.gz -C pretrained_models/2stems/

完事儿后的目录为 这样:
在这里插入图片描述

3:测试人声分离

步骤:
①:下载或者上传一段音频到  spleeter 项目文件夹下,例如为  audio_example.mp3

②:在项目根目录下运行脚本命令:
	
		spleeter separate -p spleeter:2stems -o output audio_example.mp3	
		
③:运行后,会在spleeter目录下生成 output 文件夹,并在 output 文件夹下生成以音频名称为名的文件夹,伴奏和人声放在此目录下,如下图

在这里插入图片描述

到此,音频文件的人声和伴奏就分离完成了,可以试听下效果。这个小工具可以当做你项目中的一个分离服务,通过改编成接口的形式,提供给你的项目使用。

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值