自Stable Diffusion模型问世以来,AI文本图片生成技术便飞入寻常百姓家,让创意与想象触手可及。近期,有网民巧妙利用现有真人图片,通过模型自主学习,产出效果令人惊叹,甚至难以分辨是AI杰作还是真实拍摄。
为助您踏上这场AI创作之旅,本文将从零开始,引导您搭建专属的真人AI网站。
搭建您的AI创作平台
回顾过往,我曾分享过在本地部署文本图像生成网站的教程。而今,您可轻松借助GitHub仓库:stable-diffusion-webui,开启您的创作之旅。
首先,在您的电脑上安装Python 3.10.6。若已安装其他版本,可利用Conda增设一个3.10的虚拟环境。随后,下载该仓库代码,并安装适配GPU的PyTorch,访问官方网站https://pytorch.org/get-started/locally/获取安装命令。在创建的“novelai”虚拟环境中执行这些命令。安装成功后,通过测试确保PyTorch运行无误。
接着,进入GitHub仓库代码文件夹,安装必要的第三方依赖。
模型获取与汉化
网站搭建完成后,需下载适用的AI模型以驱动内容生成。网友已训练诸多模型并分享至网络,如访问https://civitai.com/这一被誉为“C站”的宝藏之地,您可发现众多惊喜模型,如用于生成真人图片的ChilloutMix模型。下载后,将其存放至工程目录:models/Stable-diffusion。
此外,stable-diffusion-webui项目支持第三方插件下载,包括汉化包。访问https://github.com/dtlnor/stable-diffusion-webui-localization-zh_CN下载汉化插件,解压后置于extensions目录,重启服务并启用插件。在“设置”中选择zh_CN,重启网页以应用更改。
创意生成:真人图片与多样化风格
启动主程序’launch.py’,等待网页地址出现。打开网址后,如遇模型未更新,可尝试重启。选择ChilloutMix模型后,前期部署工作即告完成。接下来,我将详细指导您如何生成心仪图片:
- 生成真人图片:参考C站上的promt生成图片示例,将相应Prompt词语填入指定框内,调整参数后生成图片。
- 风格转换:利用Lora模型调整画风,如下载原神Lora模型并置于models/Lora路径下,调整Prompt以生成风格化图片。
- 动画视频生成:安装“deforum”插件,根据多张图片合成视频。访问https://github.com/deforum-art/deforum-for-automatic1111-webui下载插件并重启网页以启用。执行简单生成操作后,即可获得动画视频。
让图片“开口说话”
借助生成的图片,您可进一步制作AI说话视频。访问https://studio.d-id.com/选择您的图片并输入台词后生成视频,即可获得逼真的AI说话效果。这一技术将批量制作二次元及真人说话视频变为可能,预示着AICG行业的颠覆性变革与广阔应用前景。
至此,本文内容已告一段落。我是您的引导员,期待与您在下期再会!