惊艳!AI图像生成技术让你见证不可思议的奇迹
在日常生活中,你是否曾使用过修图软件?如果答案是肯定的,那么你很可能已经与AI图像生成技术有过接触。例如,去除水印、添加滤镜等操作,都属于广义上的AI范畴。
目前,AI在图像生成方面展现出了两种最成熟的落地使用场景:图像编辑工具和图像自主生成。图像编辑工具的功能广泛,包括去除水印、提高分辨率、特定效果添加等。而图像自主生成则是指近期兴起的AI绘画,这包括创意图像生成(随机或按照特定属性生成画作)与功能性图像生成(如生成logo、模特图、营销海报等)。
2022年下半年,AI绘图无疑成为了热门应用,许多人在朋友圈分享各种形式的AI作品。从参与度和可玩性来看,AI绘画大致可以分为三类:借助文字描述生成图像、借助已有图像生成新图像,以及两者的结合版。
当被问及为何喜欢AI绘画时,有用户表示:“我小时候就喜欢画画,但天赋有限。家里觉得既然走不了艺考,还是好好学习更重要,因此没有花太多精力在上面。但现在,AI绘画实现了我曾经的梦想。”曾经因各种原因放弃或未学习绘画的人,在这个时代仅凭输入几个词语或一段文字,就能得到一张还不错的绘画作品。例如,在AI绘画工具Stable Diffusion上输入“一座复古未来主义的空中浮岛”的英文描述,即可得到一张生动的图片。
这些神奇的生成效果仿佛魔法一般。事实上,从文本到图像的生成过程确实存在“咒语”,即被用来激发创作与思考的提示词。这些提示词可以是一个问题、一个主题、一个想法或一个概念,在AI绘画的语境下可以理解为“喂给”AI进行创作的一组灵感词组,通常是对自己设想作品的简要描述。
现在流行的国外AI绘画工具如Stable Diffusion、DALL·E2、Midjourney等,以及国内工具如文心一格、意间AI绘画、AICreator等,都会在创作时引导你输入“咒语”。如果你暂时缺乏灵感,有些平台还提供“自动生成”选项,让AI帮你自主搭配并进行修改。
如此,AI降低了普通人参与艺术创作的门槛,让没有绘画基础的人也能通过文字描述表达自己的创作灵感并满足创作欲望。例如,想要一幅中国风的山水画时,可以输入提示词:水、林木、云雾、山石、溪流、山峦、霞光、水墨画、中国风、低饱和。AI成功读取这些“咒语”后,会返回一幅符合要求的山水画作。
如果对画家及其作画风格有所了解的话,还可以在编写“咒语”时加入这些画家的名字进行定制。AI绘画工具不仅支持知名画家如达·芬奇、梵高、毕加索等的画风,还支持众多现代画家的画风。如果想要复古神秘的画风可以尝试加入英国插画师汤姆·巴肖(Tom Bagshaw)的名字;想要CG(计算机动画)人物画则可以加入代表性画师Artgerm、阮佳(Ruan Jia)的名字。为了方便读者感受融入特定风格生成画作的效果我们利用Jasper.AI生成了具有张大千风格的“轻舟已过万重山”和具有梵高风格的“手捧玫瑰花的少女”。
除了构图与风格调整外AI的能力还超乎你的想象它能够辨别2D与3D满足用户的精细化定制需求。例如当我们想在人物画上生成小狗时DALL-E2会把小狗画入画中;而当我们想要把一只3D小狗画在座位上时DALL-E2便能生成一只真实的三次元小狗。
伴随着AI绘画技术的逐渐成熟AI插画也被用于一些具有功能性的场景中。例如2022年6月11日著名杂志《经济学人》首次采用了AI插画作为封面作品名为《AI的新边界》。在封面油画风格的分割色块背后有着一张具备少量机械特征的人脸预示着AI将以全新的面貌出现在我们面前拓展人类技术的新边界。此外AI绘画还被用于游戏开发环节包括前期的场景与人物图辅助等。
虽然AI绘画对内容生产力的提升具有很大帮助但与此同时也引发了许多人的忧虑包括艺术家担心AI绘画可能会因为训练样本的选取而剽窃自己的作品元素以及担心这些AI生成的作品被用于欺骗性用途危害人类自身。然而针对这一辩题Midjourney的创始人大卫·霍尔兹(David Holz)这样评价:“AI是水而非老虎。”他强调水固然危险但人类可以学会与之相处并利用其带来的机会。事实上艺术家是否买单尚且不论投资人已经开始竞相押注。例如Stable Diffusion的母公司Stability AI在2022年10月17日宣布完成1.01亿美元融资成为估值10亿美金的超级独角兽;随后不到一个月另一家AI绘画平台Jasper.AI也宣布完成了1.25亿美元A轮融资估值达15亿美元距离产品上线也不过18个月的时间。
从技术开发到应用落地虽然有一定时间差但在图像生成领域我们正看到日益成熟的应用场景以及商业化的可能性。