roop工具使用方法

sensevoice-small-轻量级多任务语音模型的 ONNX 量化版WebUI V1.0

端侧应用:手机 / 平板 / 嵌入式设备的离线语音助手、实时字幕。 边缘计算:无 GPU 服务器的语音转写、客服质检、会议纪要。 隐私敏感场景:医疗 / 金融等需本地处理语音数据的业务。 低资源环境:带宽有限或算力不足的设备与场景。

一、roop工具的效果

roop说明:Take a video and replace the face in it with a face of your choice. You only need one image of the desired face. No dataset, no training。

原图如左边所示,roop替换后的效果如右边所示。

二、linux下安装方法

1、github上下载代码

链接地址:GitHub - s0md3v/roop: one-click deepfake (face swap)

2、源码中requirements.txt的python包都安装一下

3、安装roop模型

onnx模型地址:https://huggingface.co/henryruhs/roop/resolve/main/inswapper_128.onnx

 模型放到roop根目录/models/下

4、下载insightface模型

链接地址:https://github.com/deepinsight/insightface/releases/download/v0.7/buffalo_l.zip

 下载后解压该文件,放到/root/.insightface/models/下

三、roop使用

1、单张照片替换的命令

python run.py -s /data/work/xiehao/temp/pic/gaoyuanyuan.jpg -t /data/work/xiehao/temp/pic/00010.png -o test.png

执行日志如下:

2、视频替换的命令

python run.py -s /data/work/xiehao/temp/pic/gaoyuanyuan.jpg -t /data/work/xiehao/temp/video/tiemo2.mp4 -o ./output/tiemo2_1.mp4 --keep-fps --keep-frames

执行日志如下:

您可能感兴趣的与本文相关的镜像

sensevoice-small-轻量级多任务语音模型的 ONNX 量化版WebUI V1.0

sensevoice-small-轻量级多任务语音模型的 ONNX 量化版WebUI V1.0

文本生成
语音识别
SenseVoiceSmall

端侧应用:手机 / 平板 / 嵌入式设备的离线语音助手、实时字幕。 边缘计算:无 GPU 服务器的语音转写、客服质检、会议纪要。 隐私敏感场景:医疗 / 金融等需本地处理语音数据的业务。 低资源环境:带宽有限或算力不足的设备与场景。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值