解读 | 从谷歌AI判定阿波罗登月“造假“来谈谈合成图片检测技术

AI百科4个月前更新 快创云
55 0

  大家好,欢迎关注我的公众号,我将为大家分享更多前沿科技的内容。

  最近,谷歌AI判定阿波罗登月“造假”的事件引起了广泛关注,这让我们不得不谈谈合成图片检测技术。

  从下图可以看出,格拉西门科所说的“红色部分是他们的神经网络标出的判定为假的地方”,也就是说这张照片上几乎所有物体都被判定是假的。这显示谷歌AI并不是进行简单的分类任务,而是有类似分割任务的表达。这种技术更加精细,能够准确指出图片中哪些部分是合成的。相比之下,如果是直接进行二分类任务,会显得非常笼统,无法准确表达具体哪里是合成的。而这里使用的技术能够更细腻地表达:红色部分是合成的,蓝色部分是真的。这样我们可以很直观地观察到图片的哪些部分被伪造了。

  图像合成(Image Composition)是将一张图的前景剪切并嵌入到另一张背景图中,以生成新的合成图。在更广泛的层面上,图像合成包括将来自不同图像的多个视觉元素融合到同一张图中。这个技术广泛应用于人物换背景、虚拟社交、电影特效、广告图片等的制作生成。为了达到理想的效果,通常会将图像合成与图像生成(Image Generation)结合使用。图像生成负责从无到有地创造图像,而图像合成则负责将已有元素巧妙精准地组合在一起。

  图像合成和图像生成的代表就是PS和AIGC。现在的AIGC非常火热,下面展示了一些AIGC的“生成创造性”。有人认为现在AIGC这么火热,可能会直接取代PS这种艺术创造类型的工作。但我认为AIGC具有随机性,适合生成一大堆图像然后从中挑选,而PS则能够“指哪打哪”,精确完成期望图像的生成。从这个角度来说,若阿波罗登月是假图,它一定属于图像合成,而非图像生成。

  对于图像合成有多种手段来实现,从流程上来说主要分为拍摄阶段和后期修图阶段。拍摄阶段可以使用布景摆拍、光照控制、道具添加、遮挡重叠等来模拟真实环境或先摄影一些待合成的子图用于后期合成制作;后期修图阶段则可以使用蒙版、透明度、景深等图像处理工具来达到图像合成的目的。

  来看一些效果展示,好的图像合成是非常逼真的。比如下面的鲸鱼图片,你能看出它是合成的吗?

  如果你不知道鲸鱼是在海里的,你能看出下面的图是合成的吗?比如更加先进的加勒比海盗电影中的各种特效的合成。

  回过头来看阿波罗登月事件,如果登月的图片是伪造的,考虑到当时的P图软件或P图算法没有现在这么先进,那么通过摄影技术进行图像合成的可能性更大。比如去模拟月球的环境进行拍摄,这就像拍摄好莱坞电影那样。但事实真的是这样吗?还是回到下图,注意“标红为假、标蓝为真”,可以清楚地看到像人、影子、仪器等被标红了,说明这些前景是合成的。这很有可能是宇航员、影子、实验仪器等前景在一个其他干净背景下拍摄,然后做蒙版抠图嵌入到“月球表面”背景之中。

  那么谷歌AI是怎么识别图像是否是合成的呢?由于它没有开源,所以只能猜测大概。目前一些主流的图像合成检测算法也大差不差。使用AI识别图像是否是合成主要是利用一些特征提取和匹配的方法来判断图像中的像素是否与其他临近像素或对等图像有明显的差异。因为在进行图像合成时,即使技术再高超,也会引入一些噪声。目前有一些常用的方法可以检测是否是合成图:统计分析法、特征提取法、深度学习法。

  这里例举了三种方法,而对于谷歌AI的识别,你可能觉得它一定只是深度学习算法。但实际上,比如我之前做过工业视觉检测,主要使用的是传统的数字图像处理算法,但对外都宣称“智能AI检测算法”。这种“宣传”和“智能AI”会给你一种深度学习算法的错觉。所以,我觉得谷歌AI识别图像是否合成的算法也很可能是数字图像处理算法和深度学习的结合应用。当然,也不排除使用大模型的可能性,毕竟大模型是“万能的”。

  这一切的前提都是“阿波罗登月是造假的”。时过境迁,现在顺着正向推理已经很难,而通过更加先进的技术来逆向判断是个非常有趣的方式。

© 版权声明

相关文章