🐰 关注公众号「白兔AI」
扫码关注公众号,获取更多AI绘画教程和提示词
✨ 白兔去水印小程序
免费去水印工具,一键去除图片/视频水印
txt2img核心参数概览
txt2img(Text to Image)是Stable Diffusion最基础也是最常用的功能,通过文本提示词从零开始生成图像。掌握核心参数的设置是获得高质量生成结果的关键。
核心参数包括:Sampling Method(采样方法)、Sampling Steps(采样步数)、CFG Scale(分类器自由度引导)、Width/Height(图像尺寸)、Seed(随机种子)、以及Batch Size(批次大小)。
每个参数都对生成结果有不同的影响,理解它们的作用机制和最佳设置范围,可以大幅提升你的AI绘画效率和质量。
采样方法(Sampler)选择
采样方法是影响生成质量和速度的核心参数。不同的采样方法有不同的特点和适用场景。
Euler a:最常用的采样方法之一,速度快且质量稳定。适合大多数通用场景,特别是动漫风格。
DPM++ 2M Karras:质量更高但速度稍慢,适合需要更精细细节的场景。是目前最受欢迎的采样方法之一。
DPM++ SDE Karras:质量最高但速度最慢,适合需要极致质量的重要作品。
DDIM:经典采样方法,速度快但质量一般。适合快速预览和实验。
推荐新手使用 DPM++ 2M Karras,它在质量和速度之间取得了最佳平衡。
采样步数(Steps)设置
采样步数决定了AI在生成过程中进行多少次迭代。步数越多,理论上图像质量越高,但超过一定值后提升会非常有限。
20步:最低可用步数,适合快速预览和实验。质量一般,细节可能不够丰富。
25-30步:推荐的标准步数范围。在质量和速度之间取得了良好平衡,适合大多数场景。
35-50步:高质量设置,适合需要精细细节的重要作品。
50步以上:通常没有必要,除非使用特定的采样方法。超过50步后质量提升非常有限。
建议从25步开始,根据需要逐步调整。
CFG Scale设置
CFG Scale(Classifier Free Guidance Scale)控制AI对文本提示词的遵循程度。较高的CFG值意味着AI更严格地遵循提示词,较低的值则给AI更多的自由发挥空间。
CFG 3-5:AI有较大的自由度,生成结果可能与提示词有较大偏差,但可能产生意想不到的创意效果。
CFG 7-9:推荐的标准范围。AI在遵循提示词和保持创意之间取得了良好平衡。
CFG 10-12:AI严格遵循提示词,适合需要精确控制生成内容的场景。
CFG 13以上:过于严格,可能导致图像质量下降、色彩过饱和或出现伪影。
建议从7开始,根据效果逐步调整。大多数场景下7-9是最佳范围。
图像尺寸设置
图像尺寸直接影响生成质量和显存占用。Stable Diffusion的默认训练尺寸是512x512(SD 1.5)或1024x1024(SDXL)。
SD 1.5最佳实践:使用512的倍数。常用尺寸包括512x512、512x768、768x512等。避免使用过大的尺寸,否则可能出现画面重复或质量下降。
SDXL最佳实践:使用1024的倍数。常用尺寸包括1024x1024、1024x1536、1536x1024等。
Hires. fix(高清修复):对于需要高分辨率输出的场景,建议先生成512x512的基础图像,然后使用Hires. fix放大到目标尺寸。这比直接生成大尺寸图像效果更好。
Seed(随机种子)的使用
Seed值决定了AI生成过程中的随机噪声起点。相同的Seed值和参数会产生完全相同的图像。
Seed -1:每次生成使用随机种子,产生不同的结果。这是默认设置。
固定Seed:使用特定的Seed值可以复现之前的生成结果。这在调试提示词和参数时非常有用。
Seed的应用场景:当你获得满意的生成结果后,记录Seed值,可以在相同参数下复现该结果;微调提示词时保持Seed不变,可以更清晰地看到提示词变化的影响。
批量生成设置
Batch Size和Batch Count可以让你一次生成多张图像,提高创作效率。
Batch Size:每次生成同时处理的图像数量。增加Batch Size会线性增加显存占用。建议设置为1-4。
Batch Count:连续生成的批次数量。不影响显存占用,但会增加总生成时间。适合需要大量变体的场景。
对于探索创意方向,建议使用较高的Batch Count(如10-20)来获得足够多的变体。对于精细调整,使用较低的Batch Count(如4-8)即可。
总结
Stable Diffusion txt2img的参数设置是AI绘画的基础技能。通过理解每个参数的作用机制和最佳设置范围,你可以快速找到适合不同场景的参数组合。
推荐新手从以下基础设置开始:采样方法 DPM++ 2M Karras、步数 25-30、CFG Scale 7-9、尺寸 512x768。然后根据具体需求逐步调整各参数,积累经验后你会越来越擅长参数优化。