算力和数据是影响深度学习模型性能的两个关键因素。在算力资源充足的情况下,为了提升模型精度,需要为神经网络提供海量的优质素材数据。通过测试发现,素材的数量、均衡度以及标注质量对训练出的模型精度具有显著影响。
常见的算法模型训练所需的素材格式主要包括:
二维图像文件
与二维图像相关联的人工标注信息,包括目标坐标[(xmin,ymin)(xmax,ymax)]/大小、目标类型(class)
模型训练过程即将这些素材输入神经网络,通过反复迭代优化,以获取效果最佳的通用模型。在实际应用时,模型会根据检测到的目标对象输出坐标/大小、目标类型及置信度。以特定数据类型表示如下:
(xmin,ymin,xmax,ymax,class,score)
可设定一个阈值,与score进行比较,以过滤部分结果。
深度学习通过输入海量标注素材,不断调整模型参数以拟合数据,最终输出效果较好的模型。之后,通过输入非素材数据预测结果,以提高预测准确率和通用性。目前常用的图像素材标注工具为labelImg,标注完成后会生成相应的xml文件,用于标识坐标和类型。
在图像标注过程中,需要人工标出目标的位置和大小,并给出或选择目标类型。因此,对人工标注有一定要求。常见的标注问题包括:
标注框过大或过小
标注框位置不准确
标注类型错误
漏标注情况存在
过标注情况存在
模糊目标也进行标注
标注分割错误问题
标注框不完整、存在缺失等。因此,一个合格的标注应具备以下因素:
标注框大小和位置合适,能将目标对象围住;
标注框的对象类型准确无误;
一个标注框中仅包含一种目标对象类型;
标注框大小适中,既不过大也不过小。
对于图像标注的合格标准,标注框大小合适意味着所画的矩形框刚好将目标对象包围住,对象与标注框间的间隙要适中。过大可能会传递不必要的信息给网络,而太小则可能导致信息缺失。此外,标注框位置合适是指标注框应准确覆盖目标对象的位置,不存在明显的偏移。对于目标遮挡的情况,需要按照业务规则进行处理,例如遮挡面积小于20%~40%的目标仍需要进行标注。同时,对于小目标的检测效果虽然因算法而异,但人眼可以分辨的小目标仍需进行标注。另外,在标注过程中要避免过标注情况的发生,对于某些业务场景中不需要进行标注的对象(如国际通用的Logo)应予以排除。对于非常模糊的目标对象则无需进行标注。在对象分开标注问题上,需要根据具体业务场景进行区分处理。例如,当背景为纯色且图像中的对象可以被分割为一个独立可识别的对象个体时,应进行单独标注;否则应作为一个整体进行标注。最后,在标注过程中要注意避免标注框不完整的情况出现。这种情况通常是由于标注软件Bug或人工标注出现越界导致的部分框缺失问题。通过采用多种方式来保证素材质量可以提升深度学习模型的性能并避免上述常见问题。具体来说可以从以下几个方面入手:首先收集尽可能多的素材数据以提高素材数量;其次注重素材的均衡度以确保多样性分布;最后加强数据标注和检查环节以提高标注质量并避免单纯追求速度而忽视质量的问题发生。同时定期安排专人对标注素材进行审核也是确保质量的关键措施之一。