本文主要分为四部分:
- 图生图原理
- 图生图流程介绍
- 随机种子Seed的应用
- 图生图应用场景
在上一篇文章中,我们讲解了Prompt提示词原理,并展示了通过“文生图”结合Prompt提示词生成的作品。今天,我们将详细探讨Stable Diffusion(简称SD)中的“图生图”功能。
图生图原理
前文我们介绍了“文生图”,但“文生图”最大的特点是“随机性”,对图片的操作几乎不可控,生成的图片可能并不符合我们的需求。在现实生活中,这种对需求的偏差与错误理解很常见。例如,当你作为客户提出设计需求时,除了用文字描述,通常会找一张类似风格的图片,说:“跟这张图差不多的风格,帮我模仿这张图。”在AI的世界里,同样存在这样的情况。“文生图”如同你不断用语言与AI设计师沟通,但AI对你的需求理解可能存在偏差。“图生图”则像是你提供一个模板给AI设计师,说:“按照这种风格来。”这样,AI从图片中获得更多信息,原图中的像素信息在“加噪”和“去噪”的过程中被作为特征反映在作品上,最终越来越接近你的需求。简单来说,“图生图”可以帮助你把一张图片变成另一种模样。
图生图流程介绍
在SD中进行“图生图”主要分为三步:导入图片、书写提示词、调整参数。
第一步:导入图片
打开SD WebUI,找到“图生图”操作界面。基本功能与“文生图”类似,但中间多了一个“上传图片”的流程。这个位置是我们上传本地图片到SD中的主要环节。将准备好的图片上传上去后,还有其他功能如涂鸦、局部重绘、涂鸦重绘等,这些功能在后续环节中会详细讲解。
第二步:书写提示词
“图生图”的提示词与“文生图”的提示词书写逻辑相同。当然,在“图生图”中,提示词也非常重要。我们可以用上篇文章中学到的知识,尝试描述一下刚刚上传的图片的特征。先简单做个示范。
第三步:参数调整
“图生图”的参数与“文生图”参数基本相同,但也有一些“图生图”特有的参数,例如“重绘幅度”。一般设置在0.6~0.8之间。其他参数如“采样方法”、“提示词引导系数”、“迭代步数”、“图片分辨率”等也需要根据需求进行调整。全部设置完成后,点击生成,就可以利用“图生图”生成一张新的图片。
随机种子Seed的应用
尽管提供了原图、准确的提示词和合适的参数,但AI的生成过程仍然具有随机性。例如,如果原图背景是室外,而生成的图片却是室内,我们可以通过增加和修改提示词来达到想要的室内效果。但新的问题可能出现,如人物姿势的改变。这时就需要用到“随机种子”。AI生成一幅作品的过程是随机的,但每次生成都有一套描述方式,这套描述方式会被记录成一组随机数,即随机种子。不同的随机种子生成出来的图片肯定不同,但如果用同一个随机种子生成图片,那么两组图片的相似度会非常高。因为每次生成都会生成一套随机种子,有的效果好,有的效果差。你可以简单地把随机种子理解成AI生成这张图的唯一编号。在“随机种子”选项中,左边的按钮可以把随机种子设置为-1,即每次都生成新的种子;右边的循环按钮代表重用上一次使用的随机种子。当然,除了这两种方式外,你也可以自行输入上次生成的随机种子。将上一次的随机种子作为本次的随机种子后,点击生成图片,此时两张图片的风格和姿势就会很相似了。
图生图应用场景
了解了“图生图”的细节后,我们来说说它的具体应用场景:
场景一:将原图进行二次加工
例如将原图中的某些元素进行替换或添加新的元素。这个场景很多AI相机都可以实现,但SD WebUI能更细致地操作这个演变过程,更可控。
场景二:把非人像的图片变成人物形象
例如将风景图片变成人物画像。这种方式可以制作风景的拟人画。
场景三:将草稿图通过AI进行补全
例如将不完整的草图上传到SD WebUI中,用准确的提示词进行描述后生成完整的图片。
此外,“图生图”还有更多应用场景可以发挥你的想象力去探索。