PASCAL 视觉对象类挑战 2007,2011 (VOC2007, 2011) 注释指南
本文档复制了 VOC2007 数据集中用于注释图像的指南。
一, 关于标签内容和方式的指南
标注什么
定义类别的所有对象,除非:
- 你不确定对象是什么。
- 对象非常小(由您自行决定)。
- 不到 10-20% 的物体是可见的。
如果由于对象太多而无法做到这一点,请将图像标记为不良。
视点 Viewpoint
记录物体“大块”的视点,例如身体而不是头部。允许 10-20 度范围内的视点。
如果不明确,请保留为“未指定Unspecified”。
边界框 Bounding box
标记对象可见区域的边界框(不是对象的估计总范围)。
边界框应包含所有可见像素,除非边界框必须做得过大以包含一些额外的像素(<5%),例如汽车天线。
遮挡/截断 Occlusion/ truncation
如果超过 15-20% 的对象被遮挡并位于边界框之外,则标记为“截断”。
如果遮挡区域位于边界框内,则不要标记为截断。
图像质量/照明 Image quality/ illumination
质量差的图像(例如过度运动模糊)应标记为差。然而,照明不佳(例如轮廓中的物体)不应算作质量差,除非无法识别物体。
由多个图像组成的图像(例如拼贴画)。

本文档详细介绍了PASCAL VOC2007和2011数据集的图像注释规则,包括标注内容、视点、边界框、遮挡/截断、图像质量、透明度等方面的标准。同时提供了分类指南,如飞机、自行车、船只等物体的特定注释要求,并概述了分割图像的精度和注意事项。对于难以分割的图像,允许不进行标注。

2321

被折叠的 条评论
为什么被折叠?



