分离音频的人声和背景音/音轨----spleeter

原创已于 2025-12-14 23:25:32 修改 · 1.5k 阅读

9 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#音视频

于 2024-06-14 18:10:34 首次发布

python 同时被 3 个专栏收录

14 篇文章

订阅专栏

AIGC

12 篇文章

订阅专栏

Shell

5 篇文章

订阅专栏

Python3.8

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

介绍

这是一个基于python 语言编写的一个工具类小项目，运用了spleeter 库，分割音频中的人声和背景音，目前测试效果还是比较好，主要是免费的就是香。如果你做自媒体，或者AIGC相关音频项目，相信这是个对你很大帮助的小工具。

开搞

环境：

	python >=3.9   linux  ubantu20.04，其他系统请自行灵活应变

1：安装必要组件

	apt install ffmpeg
	pip install spleeter

2：创建spleeter项目环境

	1：在你自己喜欢的目录下创建spleeter文件夹
	
		mkdir spleeter && cd spleeter
		
	2：在spleeter下创建raw文件夹以备用，创建pretrained_models 模型文件夹
		
		mkdir raw
		mkdir pretrained_models
	
	3：下载模型到spleeter下的 pretrained_models 文件夹内
		
		wget -P pretrained_models https://github.com/deezer/spleeter/releases/download/v1.4.0/2stems.tar.gz
	
	4：把模型解压到  pretrained_models  文件夹下的 2stems 文件夹内
	
		mkdir -p pretrained_models/2stems
		tar -zxvf pretrained_models/2stems.tar.gz -C pretrained_models/2stems/

完事儿后的目录为这样：
在这里插入图片描述

3：测试人声分离

步骤：
①：下载或者上传一段音频到  spleeter 项目文件夹下，例如为  audio_example.mp3

②：在项目根目录下运行脚本命令：
	
		spleeter separate -p spleeter:2stems -o output audio_example.mp3	
		
③：运行后，会在spleeter目录下生成 output 文件夹，并在 output 文件夹下生成以音频名称为名的文件夹，伴奏和人声放在此目录下，如下图

在这里插入图片描述