底层原理
扩散算法
从生成噪点到去除噪点的过程
CLIP(翻译)
Text Encoder文本编码器的一种,把人类的语言翻译成计算机理解的语言
文本信息(关键词)->数字化描述(函数/向量)
CLIP算法根据模型训练数据/经验/参数,大概感知到需要的特征
Latent Space(压缩)
翻译后的语言会进入到Latent Space里面,潜空间。压缩的过程,将512x512x3压缩为64x64x4
采样器、调度器、CFG Scale在潜空间内工作
U-net(去噪)
对随机种子生成噪声图进行引导
Seed
随机种子
随机种子阈值:0-4294967295
VAE解码器(解压)
通过VAE解码器进行解码
基础操作
![![[Pasted image 20250622235620.png]]](/https://i-blog.csdnimg.cn/direct/21de8fdbb1b04bdda2da70e2a1466694.png)
左键双击背景进行搜索节点
![![[Pasted image 20250622235718.png]]](/https://i-blog.csdnimg.cn/direct/7f3f637117d74e9d9398fec2c30e7e58.png)
左下角打开设置
![![[Pasted image 20250623010748.png]]](/https://i-blog.csdnimg.cn/direct/2d968682758f4e2199dd1635e51b08da.png)
左上角点开工作流可以保存
![![[Pasted image 20250623010900.png]]](/https://i-blog.csdnimg.cn/direct/bba33525046647d79f52fbca5eeb443e.png)
编辑
![![[Pasted image 20250623010950.png]]](/https://i-blog.csdnimg.cn/direct/7ccf5bf286bf460ca846ff9f6227aee8.png)
管理器
![![[Pasted image 20250623011203.png]]](/https://i-blog.csdnimg.cn/direct/a32327a7bde94d46bcb9773284e72018.png)
队列
![![[Pasted image 20250623011303.png]]](/https://i-blog.csdnimg.cn/direct/a8306428063b4044b7341c248cc28f26.png)
节点库
![![[Pasted image 20250623011406.png]]](/https://i-blog.csdnimg.cn/direct/eea7333348ab4bd680b69b0937e444ea.png)
模型库
![![[Pasted image 20250623011441.png]]](/https://i-blog.csdnimg.cn/direct/25a8bf69b97c419a834c56775efaeb5b.png)
工作流
![![[Pasted image 20250623011452.png]]](/https://i-blog.csdnimg.cn/direct/0bec89009db6470883231c41c3087442.png)
搭建文生图基础工作流
![![[Pasted image 20250623104327.png]]](/https://i-blog.csdnimg.cn/direct/dc206b94804248a3a7a0f438e4af7ebd.png)
加载器
核心是大模型,定义图片风格
调用任何模型都需要加载器
![![[Pasted image 20250623104658.png]]](/https://i-blog.csdnimg.cn/direct/7a864cf2d9de4071ab80b4345e79318e.png)
![![[Pasted image 20250623104705.png]]](/https://i-blog.csdnimg.cn/direct/763391a1ee9445a79a54b772b758bd9c.png)
文本编码器
![![[Pasted image 20250623105036.png]]](/https://i-blog.csdnimg.cn/direct/cb1d657f5bfe4a0686cf54ae306b3628.png)
![![[Pasted image 20250623105212.png]]](/https://i-blog.csdnimg.cn/direct/2f028fde1c55473d8fffe2a1d36b6708.png)
采样器
![![[Pasted image 20250623105249.png]]](/https://i-blog.csdnimg.cn/direct/13825476c8a5477c81c25c8fb883c174.png)
![![[Pasted image 20250623105340.png]]](/https://i-blog.csdnimg.cn/direct/d91dcbaf710b4daa85a6c9c2f50bbc15.png)
随机种子:SD渲染时用到的随机噪声
完全随机就把随机种调到0
运行后操作:
![![[Pasted image 20250623105513.png]]](/https://i-blog.csdnimg.cn/direct/9e810916531f488db6277e3df400f29a.png)
固定:每次生图都是同样的种子
增加:每次生图时种子数字+1
减少:每次生图时种子数字-1
随机:每次生图时完全随机的数字
步数:代表每次生图时降噪多少次数
推荐30-40
CFG:代表关键词和图片的相关性
数值越高,图片和关键词的相关性就会越高,建议3-9
采样器:推荐euler a
dpmpp_2m_sde百搭
调度器:
![![[Pasted image 20250623112234.png]]](/https://i-blog.csdnimg.cn/direct/f522e226c9c64f2ba560a4e1fd95152b.png)
是图片在降噪时的变化曲线
正常:匀速降噪
karras:曲线降噪
exponential:极速降噪
降噪:
就是重绘幅度denoising,文生图默认值保持1,图生图时,数值越高,和原图越不相近
Latent
![![[Pasted image 20250623112729.png]]](/https://i-blog.csdnimg.cn/direct/717083f0a3d943e78cc24065e028dfcb.png)
![![[Pasted image 20250623112819.png]]](/https://i-blog.csdnimg.cn/direct/38e5961093e74717b9b27bd8dc9e1131.png)
1.5版本大模型:范围512-768之间
2.1版本大模型:768-1024之间
SDXL/SD3版本大模型:1024上下
VAE解码
![![[Pasted image 20250623113045.png]]](/https://i-blog.csdnimg.cn/direct/41b6ac74d2fb4308a537650ea7ae1441.png)
![![[Pasted image 20250623113117.png]]](/https://i-blog.csdnimg.cn/direct/41742d8dd39b4645a0632e9516dbd7ce.png)
生成框
![![[Pasted image 20250623113155.png]]](/https://i-blog.csdnimg.cn/direct/6fed622787a24c11bffaa59618788187.png)
![![[Pasted image 20250623113232.png]]](/https://i-blog.csdnimg.cn/direct/e2fb3335c1ab4d6cbe568e97a5474775.png)
1girl, eating ice cream while walkinig on the beach
embedding:EasyNegative,
![![[Pasted image 20250623113629.png]]](/https://i-blog.csdnimg.cn/direct/668935b28580476a8a4b430cd8551f50.png)
![![[Pasted image 20250623113708.png]]](/https://i-blog.csdnimg.cn/direct/d327942bc20946aca164ccbd8ee6e130.png)
VAE加载器
![![[Pasted image 20250623115333.png]]](/https://i-blog.csdnimg.cn/direct/3f355ab4051d448f99ed6e5d2a9f67d6.png)
![![[Pasted image 20250623115339.png]]](/https://i-blog.csdnimg.cn/direct/5ba2f4ff7d5e460b9f42cd3591419022.png)
可以理解为滤镜
网站推荐
Create Art or Modify Images with AI
LiblibAI-哩布哩布AI - 中国领先的AI创作平台
Civitai: The Home of Open-Source Generative AI
ComfyICU - Serverless ComfyUI Cloud

1977

被折叠的 条评论
为什么被折叠?



