与时代共振,AI助力工业缺陷检测

AI百科2周前发布 快创云
12 0

  由于深度学习强大的特征提取能力,它逐渐取代了人工目检和传统的机器视觉,成为了工业缺陷检测的新工具。然而,基于深度学习的语义分割技术在工业缺陷检测领域的应用仍面临挑战。本文首先对比了自然场景下的语义分割,概述了工业缺陷检测背景下的语义分割技术特点;接着,针对工业缺陷检测的常见难点,介绍了常见的解决方案。最后,作者提出了一些关于工业缺陷检测实际应用中问题的思考。

工业缺陷检测场景中的语义分割

  语义分割是指使用语义标签对图像中的每一个像素进行分类。相比图像分类,语义分割要求更高,因为后者只是预测整个图像的单个标签。传统机器视觉强依赖于工程师的经验与试错,而基于深度学习的方法由于其端到端自动提取特征实现分割过程的特点而逐渐崭露头角。FCN(全卷积神经网络)作为基于深度学习的语义分割技术的开创之作,早在2014年就被提出。然而,计算机视觉背景下的语义分割研究大多以自然场景为主,如常用的cityscape数据集。工业缺陷检测相比于自然场景,类别更少,且工件表面背景干扰小、变化少,且可以通过硬件(如打光)改良光照等条件以获取更好的数据集。但这并不意味着工业缺陷检测中的语义分割更为简单。

工业缺陷检测中的挑战

  1. 类间差异小,存在模糊地带:以磁瓦缺陷数据集为例,线状物体在多种缺陷或无缺陷情况下都有出现。这是数据集的固有属性,也是缺陷检测难做的原因。有些情况,由于正负样本类内差异小,绘制其直方图时,中间过渡区域存在一定量的样本处于灰色地带,很难分辨。
  2. 类内差异大:同一类缺陷下,缺陷的大小、形状、位置多变。
  3. 样本不平衡:有些数据集中存在严重的正负样本不平衡问题,良品多,不良品少。
  4. 缺陷级别小:如磁瓦缺陷数据集中有些裂痕或空洞的尺寸很小,对目标细节的分辨率要求高。

解决方案

  1. 选择适合的网络拓扑:Long等人提出的FCN是基于深度学习的语义分割模型的一个里程碑。但FCN的经验感受野不及理论感受野的1/4,因此选择能够增强经验感受野的网络至关重要。例如,U-net和SegNet都是编码器-解码器结构的代表作,通过多层卷积池化和反池化操作增强感受野。
  2. 多尺度分析:Zhao等人开发的PSPN利用金字塔池模块以四种不同的尺度汇集特征图,以捕获局部和全局上下文信息。Deeplab系列则通过ASPP模块利用空洞卷积增强感受野。
  3. 视觉注意力模型:SEnet通过挤压和激活操作增强通道域的特征表示。Attention to scale则提出了基于多尺度注意力的模型,结合不同尺度的得分图生成最终的分割结果。
  4. 处理样本不平衡:通过损失函数改进和数据增强来解决问题。基于分布的损失函数如加权交叉熵和平衡交叉熵可以改善样本不平衡问题。基于区域的损失函数如Dice loss及其变种也被广泛应用于工业缺陷检测中。此外,数据增强方法如几何变换、色彩变换和生成对抗网络等也可以从原始数据集中提取更多信息。

思考

  1. 评价指标:工业缺陷检测的指标需要具体情况具体分析。有些场景下的工业缺陷检测并不需要逐像素分类准确,需要知道缺陷种类和大致位置即可。因此,应结合实际情况设置合适的评价指标。
  2. 增量学习:不良品样本会在产线中不断产生,能否保持前期训练的模型并利用新数据追加训练模型成为关键问题。增量学习如Lwf(learning without forgetting)可能成为未来工业缺陷检测结合紧密的方向。

  通过本文的探讨,我们可以更深入地了解基于深度学习的语义分割技术在工业缺陷检测中的应用与挑战,并探索有效的解决方案以应对这些挑战。

© 版权声明

相关文章