StableDiffusion的设置和使用起步
起手设置
起手设置和必备的插件安装与优化
重要的文件路径
stable diffusion web ui
embeddings : 存放后缀是pt、safetensors等格式的向量文件
经典:Easy Negative、bad hands ,使用在负面词上应用点击。作用:优化和减少人物手指错误
extensions:插件的存放位置
models:大模型存放位置
hypernetworks:
Lora
VAE 画风文件
Stable-diffusion:模型和文件图片一致文件名称就能加载封面
模型前面加上前缀好区分:3D前面用2.5D、真人Rel、官方SD、二次元Ton
VAE、Clip Skip功能设置
setting=>Show all pages=》快捷设置列表=》(搜索vae选中sd_vae、搜索clip选中Clip stop last layer)=>重启UI界面
重启后这里多了两个快捷设置
插件安装
汉化包
双语翻译
无边图库
ControlNet
在线插件库安装:Extensions=>Available
bilinggual
主题插件界面美化
lobe
采样方法
采样设置推荐
- 迭代步数控制范围一般显卡20-30,高端硬件可以用40-50
- 推荐Euler a、DPM++SDE Karras、DPM++2M Karras
- 高分辨率修复,用于提高图片分辨率,推荐 BSRGAN 算法
- 控制住一次性出图的设置,调整生成批次控制1-4即可
- 随机种子,-1表示图的主体内容是随机的
- 宽高:初始海选时小图即可选中后再高清修复
512*512、512*768(4:3)、768*512(3:4)
- 提示词相关性:CFG Scale 约束 Ai 的程度,相关性越高,出图遵守提示词描述的范围生成图片;相关性越低,无约束的随机生成图片(类似抽盲盒)正常默认不用改7-8即可
SD提示词基础
提示词提示词之间英文逗号,分隔
提示词之间可以换行,换行时需要在结尾用,分开
每个提示词权重默认是1,越靠前权重越高
数量控制在 75 个单词以内
正向提示词使用思路
使用正向提示词时,通过分类描述的方式给出。具体可以分为三类:整体描述、主体、背景环境
- 整体描述:
- 画质:高画质、中等画质、低画质、2K、4K等
- 画风:CG、二次元、真人等
- 镜头:画中人物占比、半身像、全身像
- 色调:冷色调、暖色调
- 主体描述:
- 对任务主体的描述包括三方面:头部、服饰、姿势
- 头部:眼睛大小、颜色、形状;鼻子大小、形状;下巴;皮肤颜色和纹理(光滑、褶皱)、眼睛的纹理、唇色、发色
- 服饰:衣服、裤子、鞋以及其他细节例如袜子等
- 姿势:人物的姿势、左立跑等
- 场景:自热、人文、山、树、宫殿、庙宇
- 对任务主体的描述包括三方面:头部、服饰、姿势
- 背景环境描述:
基础的环境描述一般包括三个内容:时间、地点、天气,可加入一些细节,例如天空中的蝴蝶、花瓣等
masterpiece,best quality,ultra-detailed,extremely detailed CG unity 8k wallpaper
杰作,最佳质量,超详细,非常详细的CG unity 8k 壁纸
负向提示词使用思路
- 低质量:低质量、畸形的手、画的不好的脸、超出画框、解剖错误、签名、低对比度、过度曝光
- 不合法:nsfw-不适宜在工作场所查看的内容、武器、血液、血腥、暴力、裸体
- 非目标风格:想生成“摄影”风格就可以把“油画”、“漫画”作为负向提示词屏蔽
Negative,bad anatomy,bad hands,worst quality,low quality,username,blurry,scantily clad
消极负面,解刨学不好,手不好,质量最差,用户名,模糊,衣着暴露
各种符号的意义
微调提示词权重
小括号:包裹的提示词权重变为 1.1 倍,最多可以嵌套3层小括号 1.331倍
中括号:包裹的提示词权重变为 0.9 倍,最多3层嵌套 0.729 倍
大括号:包裹的提示词权重变为 1.05 倍,最多3层嵌套 1.15 倍
小括号包裹冒号直接设置权重,一般 0.3~1.5之间。例如(Red:1.5)
尖括号:用来调用Lora, <lora:文件触发词:权重>
调用 Lora 可以更好的产生出特定特征的主题画面
下划线:连接作用,可以让词汇和词汇更好的理解成一个整体
渐变
语法形式:[Tag1:Tag2:数值]
控制提示词的生效时间
单冒号[提示词:0-1数值]
: 采样进程多少时开始计算采样
双冒号 [提示词::0-1数值]
: 从开始采样进程开始到少时是停止计算采样
交替采样
例如:头发颜色红色和蓝色交替就可如下
经典提示词
画质词:起手式、杰作、最高画质、分辨率超级大
风格词艺术风格词:照片、插画、动画、立绘、概念设计
图片的主题:画的主体是一个女孩子还是一个猫,萝莉还是御姐;
角色外表:注意整体和细节都是从上到下描述。
发型(呆毛、耳后有头发、盖住眼睛的刘海、低双马尾、大波浪卷发)
发色(顶发金色、末端染彩色)
衣服(长裙、花边、半透明、内穿蓝色衬衫、半长袖、过膝袜)
头部(猫眼、红色眼睛)
颈部(项链)
手臂(露肩)
胸部(贫乳)
腹部(可看到肚脐)
腿部(长腿)
脚步(中靴)
角色姿势:
基础动作(站、坐、跑、走、蹲、趴、跪)
头部动作(歪头、仰头、低头)
手动作(手在拢头发、放在胸前、举手)
腰部动作(弯腰、跨坐、鸭子坐、鞠躬)
腿部动作(交叉站、二郎腿、M型开腿、盘腿、跪坐)
复核动作(战斗姿势、JOJO立、背对背站、脱衣服)
图片的背景:室内、室外、树林、沙滩、星空下、太阳下、天气如何等
通用负面
必须安装的提示词插件
One Button Prompt:给一个主题可以帮生成不同风格类型的图片,自动丰富关键词
sd-dynamic-prompts:动态提示词
prompt-all-in-one:中文翻译成英文、鼠标操作顺序和权重
最终结论
Euler、Euler
快速获得简单的结果
DPM++ 2M Karras
推荐的算法,速度快,质量好,推荐步数 20~30 步
DPM++ SDE Karras
图像质量好但是不收敛,速度慢,推荐步数 10~15 步
DPM++ 2M SDE Karras
2M和SDE的结合算法,速度和2M相仿,推荐步数 20~30 步
DPM++ 2M SDE Exponential
画面柔和,细节更少一些,推荐步数 20~30 步
DPM++ 3M SDE Karras、DPM++ 3M SDE Exponential
3M 系列。步数需要 30 步以上,且 CFG 要低一些。
打开webUI目录下的G:\ai\stable-diffusion-webui\repositories\k-diffusion\k_diffusion 找到 sampling.py 在最后追加
@torch.no_grad()
def sample_dpmpp_2m_test(model, x, sigmas, extra_args=None, callback=None, disable=None):
"""DPM-Solver++(2M)."""
extra_args = {} if extra_args is None else extra_args
s_in = x.new_ones([x.shape[0]])
sigma_fn = lambda t: t.neg().exp()
t_fn = lambda sigma: sigma.log().neg()
old_denoised = None
for i in trange(len(sigmas) - 1, disable=disable):
denoised = model(x, sigmas[i] * s_in, **extra_args)
if callback is not None:
callback({'x': x, 'i': i, 'sigma': sigmas[i], 'sigma_hat': sigmas[i], 'denoised': denoised})
t, t_next = t_fn(sigmas[i]), t_fn(sigmas[i + 1])
h = t_next - t
t_min = min(sigma_fn(t_next), sigma_fn(t))
t_max = max(sigma_fn(t_next), sigma_fn(t))
if old_denoised is None or sigmas[i + 1] == 0:
x = (t_min / t_max) * x - (-h).expm1() * denoised
else:
h_last = t - t_fn(sigmas[i - 1])
h_min = min(h_last, h)
h_max = max(h_last, h)
r = h_max / h_min
h_d = (h_max + h_min) / 2
denoised_d = (1 + 1 / (2 * r)) * denoised - (1 / (2 * r)) * old_denoised
x = (t_min / t_max) * x - (-h_d).expm1() * denoised_d
old_denoised = denoised
return x
然后在采样设置里加入一行这个:
('DPM++ 2M Karras Test', 'sample_dpmpp_2m_test', ['k_dpmpp_2m_ka'], {'scheduler': 'karras'}),
C 站
Civitai: The Home of Open-Source Generative AI
R/18_19,asia,petite,white and tender,d milk,whole body,perfect body shape,big wave,small nipple,bed,phoenix eye,R/18_19,asia,petite,white and tender,d milk,whole body,perfect body shape,big wave,small nipple,cherry small mouth,bed,sex,
science and technology light,(worst quality:2),(low quality:2),(normal quality:2),lowres,((monochrome)),((grayscale)),bad anatomy,DeepNegative,skin spots,acnes,skin blemishes,(fat:1.2),facing away,looking away,tilted head,lowres,bad anatomy,residual limb,bad hands,missing fingers,extra digit,fewer digits,bad feet,poorly drawn hands,poorly drawn face,mutation,deformed,extra fingers,extra limbs,extra arms,extra legs,malformed limbs,fused fingers,too many fingers,long neck,cross-eyed,mutated hands,polar lowres,bad body,bad proportions,gross proportions,missing arms,missing legs,extra digit,extra arms,extra leg,extra foot,teethcroppe,signature,watermark,username,blurry,cropped,jpeg artifacts,text,error,residual limb,science and technology light,abrupt,