ImageNet数据集简介、下载、使用方法之详细攻略

AI百科7个月前更新 快创云
92 0

  ImageNet是一个由斯坦福大学李飞飞教授引领创建的计算机视觉数据集,它包含了14,197,122张图片和21,841个Synset索引。Synset是WordNet层次结构中的一个节点,代表一组同义词集合。自创建以来,ImageNet便成为评估图像分类算法性能的基准。

  ImageNet数据集旨在推动计算机图像识别技术的发展。2016年,该数据集中的图片数量已超过千万,且每一张图片都经过手工标注,涵盖了生活中大部分常见的图片类别。最初,ImageNet是一个包含超过100万张图像的数据集,每张图像都关联了相应的标签(类别名)。此外,每年还会举办使用该数据集的ILSVRC图像识别大赛。

  ImageNet是一个按照WordNet层次结构(目前仅涉及名词)组织的图像数据库,其中每个层次结构的节点都由数百至数千张图像来描述。目前,平均每个节点有500多张图像。ImageNet不仅提供了用于分类的数据,还提供了用于定位和检测任务的数据。定位任务同样涵盖1000个类别,准确率根据最高五项检测结果计算得出。所有图像中至少有一个边框标注,针对200个目标的检测问题,有470,000张图像,平均每张图像包含1.1个目标。

  ILSVRC(Large Scale Visual Recognition Challenge)是基于ImageNet数据集的比赛,从2010年开始每年举办一次,持续到2017年。该比赛使用ImageNet的一个子集,包含约120万个训练图像、50,000个验证图像和150,000个测试图像,共涉及1000个类别标记。在ILSVRC竞赛中,诞生了许多成功的图像识别方法,尤其是深度学习方法,这些技术在赛后得到了进一步的发展与应用。

  与CIFAR-10相比,ImageNet数据集的图片数量更多、分辨率更高、包含的类别更多(高达上千个图像类别),且图片中可能存在更多的无关噪声和变化,因此其识别难度远高于CIFAR-10。

  要获取ImageNet数据集,可访问其官方网站:http://image-net.org/。此外,知乎上也提供了关于ImageNet数据集下载与处理的指南。

© 版权声明

相关文章