1. SUN_RGBD数据集概述与下载指南
SUN_RGBD是当前室内场景理解领域最具影响力的RGB-D数据集之一,包含10,335张真实场景的RGB-D图像,规模与PASCAL VOC相当。这个数据集特别适合刚接触语义分割的新手练手,因为它不仅提供了丰富的标注信息,还涵盖了多种传感器采集的数据。
我第一次接触这个数据集时,发现它的结构比想象中要复杂。原始数据包主要包含两个核心文件:SUNRGBD.zip(约6.4GB)和SUNRGBDtoolbox.zip(约6.9GB)。前者存储所有图像和原始标注,后者则包含处理工具和元数据。下载时建议使用学术网络或稳定的下载工具,因为文件较大容易中断。
数据集中的图像来自四个不同来源:
- Intel RealSense采集的3784张
- Asus Xtion采集的1159张
- NYU Depth V2数据集中的1449张
- SUN3D视频中精选的3389张
这种多源特性使得数据集具有更好的多样性,但也带来了预处理上的挑战。比如不同设备的深度图存储格式可能不同,需要统一处理。
2. 数据预处理全流程解析
2.1 文件结构梳理
解压后的数据集目录结构如下:
SUNRGBD/
├── SUNRGBDtoolbox/
│ ├── Metadata/
│ │ ├── SUNRGBDMeta.mat # 关键元数据
│ │ └── SUNRGBD2Dseg.mat # 分割标注
├── image/ # 原始RGB图像
├── depth/ # 深度图
└── annotation/ # 各种标注
新手最容易犯的错误是直接开始处理图像而忽略元数据文件。实际上,SUNRGBDMeta.mat这个MATLAB文件包含了所有图像路径的映射关系,是预处理的关键。
2.2 核心预处理代码解读
以下是使用Python处理HDF5格式标注的典型代码:


6323

被折叠的 条评论
为什么被折叠?



