StableDiffusion3 已经发布了一段时间,收到的评价褒贬不一。
然而,不可否认的是SD是一个革命性的产品。
它的实现基于复杂的数学思想,我们在这里不讨论。下面我们仅从宏观角度来分析一下工作流程。
作为一个大规模的图像模型,其训练数据达到数十亿。训练阶段使用无监督学习神经网络来训练噪声预测模型。
该模型是SD的核心组件之一,其他核心组件包括CLIP编码器和VAE。
CLIP编码器负责将提示词转换为向量。
噪声预测模型由采样器调用,经过多次去噪操作,得到最终的潜在空间图像。
VAE 负责将潜在空间图像解码为像素空间图像。
有不同类型的采样器支持不同的采样算法。
除了常见的WebUI参数外,控制提示词的参数也比较少见。
主要包括conditionSetTimeStepRange、conditioningConbine、conditionZeroOut。
该参数可以控制采样过程中提示词的出现时间、参与方式、归零等。
如今,人工智能正在迅速发展。你应该找时间学习。
版权声明:本文由今日头条转载,如有侵犯您的版权,请联系本站编辑删除。