立冬已至,岁末将至,各大厂商纷纷发力,准备在年底前推出新成果,以拓宽人们的视野。尽管近期关于AI的新消息不多,但AI领域并未停歇。就在一个多一个月前,我们介绍了豆包的视频生成功能,而近日,豆包再次更新了新功能。
此次更新后,豆包支持“一句话编辑修改图片”了。虽然文生图技术已经发展了两三年,但这次更新无疑是国产AI图像生成领域的新突破。
有人可能会问,AI生图不是已经很厉害了吗?为什么不能修改图片?实际上,我们测试了多个文生图大模型,但支持图片精确修改的并不多,目前表现最好的就是豆包。例如,ChatGPT-4o可以生成打篮球的人像,但如果你想将环境改为沙滩,它可能无法做到,而是会改变整张图片。同样,谷歌的Gemini也无法将图中的鸡变成鳄鱼,还会改变背景。
在本地照片编辑方面,即使是豆包以前的版本,给图像换颜色的效果也不理想。但此次更新后,豆包已经能够更精准地识别并修改图片内容。例如,将脖子哥抱着的小白狗换成小黄狗时,豆包能够保留脖子哥的动作和表情,小狗的形状也与原图相似。
此外,豆包还支持图像消除、更换背景等复杂操作。例如,将米罗的照片背景换成上海陆家嘴时,豆包能够保留原图的细节。而且,豆包还能生成科幻作品中的场景,如将米罗改造成战锤40K风格。
在测试中我们还发现,如果拿AI生成的图进行修改,效果比用照片还要强上不少。例如,将一张日系写真中的衬衣颜色换成棕色时,豆包能够保留脸部的细节和背后的墙砖纹理。
那么,为什么豆包这次能取得如此显著的提升呢?原因在于其采用了SeedEdit模型。相比以前的Diffusion技术,SeedEdit更微操、更精准地控制和生成图像。它能够将图片的理解和生成融合到一个统一的大模型框架里,从而在生成和编辑图像时能够事无巨细地参考传上去的图像。
总的来说,豆包的这次更新无疑是一个技术突破。它不仅能够更精准地编辑和生成图像,还能应用于照片修改、视频剪辑等领域。未来只需向语音助手说一声“给我出图”,AI就能帮你调整到你想要的效果。