roop工具使用方法

原创已于 2023-07-17 19:32:52 修改 · 3.5k 阅读

·

0

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

标签

#roop #face #人脸替换

于 2023-07-17 14:25:29 首次发布

AIGC 专栏收录该内容

14 篇文章

订阅专栏

sensevoice-small-轻量级多任务语音模型的 ONNX 量化版WebUI V1.0

端侧应用：手机 / 平板 / 嵌入式设备的离线语音助手、实时字幕。边缘计算：无 GPU 服务器的语音转写、客服质检、会议纪要。隐私敏感场景：医疗 / 金融等需本地处理语音数据的业务。低资源环境：带宽有限或算力不足的设备与场景。

一、roop工具的效果

roop说明：Take a video and replace the face in it with a face of your choice. You only need one image of the desired face. No dataset, no training。

原图如左边所示，roop替换后的效果如右边所示。

二、linux下安装方法

1、github上下载代码

链接地址：GitHub - s0md3v/roop: one-click deepfake (face swap)

2、源码中requirements.txt的python包都安装一下

3、安装roop模型

onnx模型地址：https://huggingface.co/henryruhs/roop/resolve/main/inswapper_128.onnx

模型放到roop根目录/models/下

4、下载insightface模型

链接地址：https://github.com/deepinsight/insightface/releases/download/v0.7/buffalo_l.zip

下载后解压该文件，放到/root/.insightface/models/下

三、roop使用

1、单张照片替换的命令

python run.py -s /data/work/xiehao/temp/pic/gaoyuanyuan.jpg -t /data/work/xiehao/temp/pic/00010.png -o test.png

执行日志如下：

2、视频替换的命令

python run.py -s /data/work/xiehao/temp/pic/gaoyuanyuan.jpg -t /data/work/xiehao/temp/video/tiemo2.mp4 -o ./output/tiemo2_1.mp4 --keep-fps --keep-frames

执行日志如下：

您可能感兴趣的与本文相关的镜像

sensevoice-small-轻量级多任务语音模型的 ONNX 量化版WebUI V1.0

sensevoice-small-轻量级多任务语音模型的 ONNX 量化版WebUI V1.0

文本生成

语音识别

SenseVoiceSmall

端侧应用：手机 / 平板 / 嵌入式设备的离线语音助手、实时字幕。边缘计算：无 GPU 服务器的语音转写、客服质检、会议纪要。隐私敏感场景：医疗 / 金融等需本地处理语音数据的业务。低资源环境：带宽有限或算力不足的设备与场景。

数据猴赛雷

博客等级

码龄17年

293
原创

2627
点赞

3993
收藏

1415
粉丝

关注

私信

TA的精选

TA的历史创作历程

分类专栏

强化学习 6篇
神经网络 66篇
大模型微调 10篇
cuda 3篇
vLLM 7篇
Agent开发知识 3篇
Unity Shader 4篇
c# 6篇
游戏 102篇
Unity 78篇
Aseprite工具入门教程 5篇
Unity编程技巧 1篇
Shader 1篇
PS 5篇
游戏剧情
java 19篇
python 5篇
AIGC 14篇
crypto
日记
spark 2篇
windows工具 1篇
前端 7篇
容器技术 2篇
Android应用开发 7篇
android 1篇
InstrumentationTestCase 1篇
实例 1篇
源码 1篇
webkit 1篇

展开全部收起

上一篇：: 知识蒸馏的说明

下一篇：: Vue第一篇：最基本的概念（背诵专用）

官方同款运行环境

sensevoice-small-轻量级多任务语音模型的 ONNX 量化版WebUI V1.0

端侧应用：手机 / 平板 / 嵌入式设备的离线语音助手、实时字幕。边缘计算：无 GPU 服务器的语音转写、客服质检、会议纪要。隐私敏感场景：医疗 / 金融等需本地处理语音数据的业务。低资源环境：带宽有限或算力不足的设备与场景。

文本生成

语音识别

SenseVoiceSmall

显存大小

24GB

CPU

10核心

内存

120GB

系统盘/数据盘

40GB

无需本地环境部署，可直接运行

· AI 阅读助手

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。