AI画手“不会画手”的笑话,相信很多人都不陌生。AI在绘画领域的失误,几乎可以车载斗量。有人甚至开玩笑说,只要戴上“假手指”,就能让AI生成监控画面,从而逃避罪责。但如今,这样的伎俩已经行不通了。因为Midjourney最新发布的第五代版本——Midjourney V5,已经能够画出正常的手了。
Midjourney这个名字或许会让你感到熟悉,它去年凭借《太空歌剧院》在美术竞赛中荣获一等奖,成为了AI绘画领域的佼佼者。此次V5的发布,再次引发了广泛关注。许多用户亲身体验后,纷纷表示它“果然没有骗人”,画出的人手已经相当正常。
那么,Midjourney是如何解决这一难题的呢?关键在于它拥有了大量的手部数据。AI绘画离不开数据支持,但现实中能露出手的照片相对较少,且手部姿势多样,这都对AI提出了挑战。此前,为了让AI画出像样的人手,需要平台专门标注或用户输入详细的提示词。而Midjourney此次通过社区反馈的海量手部数据进行了迭代优化,终于能够画出正常的手了。
除了能画出正常的手外,Midjourney V5还有其他方面的升级。例如,它对光线、人物表情等细节的处理更加出色,使得生成的图片更加逼真。此前,Midjourney最擅长的是生成幻想风格的作品,即使画现实的东西也显得有些不真实。而现在的V5则更加写实,甚至让人难以分辨是否是AI所画。难怪有设计师评价:“MJ v5就像给近视患者戴上眼镜,效果清晰,4K细节拉满,太不可思议了。”
此外,V5对输入提示的理解能力更强,输出的图片也更有创意。例如,当你输入“一个肌肉发达的野蛮人,在CRT电视机旁边拿着武器、电影、8K、演播室照明”时,Midjourney V3、V4和V5会分别生成不同的图片。值得一提的是,V5还具备从“图像到文本”的逆向操作功能。你可以上传一张图片,它会告诉你生成这张图像所需的提示词。这个功能让你能更清晰地了解AI的构思过程,从而更高效地生成你需要的图片。
除了Midjourney外,另一家AI行业的巨头Stable Diffusion也推出了新工具——Stable Diffusion Reimagine。它可以根据上传的图片生成三张不同的照片。据Stability AI介绍,这个工具的使用体验非常友好,只需一键上传图片即可。然而需要注意的是,这个工具的画画水平并不稳定,有时惊艳有时拉胯。这可能与其中安装的过滤器有关,有时它会将正常请求误判为不适当请求导致输出异常结果。尽管如此Stable Diffusion的技术仍然具有开创性其用图像编码器替换原始文本的方式令人印象深刻。
总的来说技术进步的速度令人惊叹。不久前人们还在嘲笑AI绘画连手都画不明白取代人类画师是痴心妄想但如今AI已经迅速补上了短板尽管它还有很多不完美的地方但未来的发展却让人充满期待。现在我已经开始期待OpenAI旗下的DALL-E 2与GPT-4结合后会带来什么样的新惊喜了。