解读ultralytics框架训练YOLO输出的labels.jpg和labels_correlogram.jpg以及对results.csv中的内容进行可视化

原创已于 2025-08-06 20:46:07 修改 · 2.7k 阅读

32 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#YOLO #python #机器学习 #目标检测 #计算机视觉

于 2025-06-02 23:16:21 首次发布

目标检测专栏收录该内容

14 篇文章

订阅专栏

该文章已生成可运行项目，

📌使用ultralytics框架训练YOLO在runs/detect/train下会有labels.jpg、labels_correlogram.jpg和results.csv文件生成。

🥯下图是labels.jpg

左上角是训练集中每个类别的实例数，也就是这个类别的所有训练集的图像上出现过多少次，可以明显看出数据集中类别分布非常不均衡，可以为后续了解各类缺陷的样本数量，为数据增强、模型选择（例如，是否需要处理类别不平衡问题）提供依据；
右上角是展示了所有类别检测框（bounding boxes）以图像中心为原点对齐并叠加的效果。不同颜色（与左上角的图对应）的框代表不同类别的缺陷。大部分框呈现为横向较长的矩形，说明很多缺陷（或井盖）在图像中是扁平的。也存在一些接近正方形的框。框的尺寸差异较大，有很小的框，也有几乎覆盖大部分图像区域的框。中心区域框的密度最高，颜色也最深（蓝色和深色框），表明许多框的中心点都接近图像中心，并且这些框的尺寸和形状有重叠。可以直观了解各类缺陷边界框的形状、尺寸和大致位置分布，有助于设计合适的锚框（anchor boxes）（针对于anchor-based的网络）或目标检测模型；
左下角是中心点相对于整幅图的位置。x 和 y 轴分别表示缺陷在图像中的归一化坐标（0到1），颜色的深浅表示该位置出现缺陷的频率或密度。中心密集：最深的颜色集中在图像的中心区域（大约 x=0.4-0.6, y=0.4-0.6）。这表明绝大多数缺陷或关注对象（如井盖）倾向于出现在图像的中心。向外逐渐稀疏：从中心向四周，颜色逐渐变浅，说明离图像中心越远，缺陷出现的频率越低。整体分布：缺陷的分布在x和y方向上都呈现出类似正态分布的趋势，中心高，两边低。可以进一步分析缺陷或目标在图像中的空间位置偏好。如果目标总是集中在中心，可以据此优化检测算法的搜索区域；
右下角是图中目标相对于整幅图的高宽比例。width 和 height 分别代表缺陷边界框的归一化宽度和高度，颜色的深浅表示具有特定宽度和高度组合的框的出现频率。主要集中区域：在左下角有一个非常密集的区域（颜色最深），对应于宽度较小、高度也较小的框。沿着 width 轴，当 height 较小时（例如 height < 0.1），可以看到一些密度较高的点，表明存在不少宽度较大但高度较小的扁平框。这可能对应于横向裂缝、一些修补或者是扁平的井盖。分散区域：除了集中的区域，还有很多零散的点分布在较大的宽度和高度范围内，说明数据集中也存在各种尺寸的大型缺陷或物体。形状趋势：总体来看，矮而宽的框（height 小, width 大）以及小尺寸的框（width 和 height 都小）似乎是比较常见的。可以进一步分析缺陷边界框的尺寸和长宽比分布。这对于目标检测中的锚框设计、尺度变换等非常重要。例如，根据这个分布可以设计出更匹配数据特征的锚框尺寸和比例（前提是在有anchor的模型前提下）。

🎨下图是labels_correlogram.jpg

它显示了数据集中标注框（labels）的几个关键属性之间的相关性。这些属性通常包括边界框的中心点坐标 x、y，以及边界框的宽度 width 和高度 height，这些值都经过了归一化处理（范围在0到1之间）。矩阵的对角线上是各个属性的一维直方图，显示了该属性自身的数据分布。非对角线上的图是两个不同属性之间的二维散点图（或二维直方图/热力图），显示了它们之间的关系，颜色越深表示数据点越密集。

🔢对角线图（一维直方图 - 各属性的分布）

最顶部的直方图 (对应第一列 x): 这是 x (中心点横坐标) 的分布。看起来 x 的分布相对均匀，横跨0到1，可能在0.2到0.6之间略微密集一些。这表明目标物体在图像的水平方向上没有特别集中的区域，但可能稍微偏向图像的左半部分到中心。
第二行对角线上的直方图 (对应第二列 y): 这是 y (中心点纵坐标) 的分布。y 的值主要集中在0.4到1.0之间，且密度向1.0递增。这表明大多数目标物体的中心位于图像的下半部分（假设图像坐标系(0,0)在左上角）。
第三行对角线上的直方图 (对应第三列 width): 这是 width (边界框宽度) 的分布。绝大多数边界框的宽度都非常小，集中在0.0到0.2的范围内，然后迅速减少。这是一个典型的右偏分布，说明数据集中小宽度物体占主导。
第四行对角线上的直方图 (对应第四列 height): 这是 height (边界框高度) 的分布。与宽度类似，绝大多数边界框的高度也非常小，主要集中在0.0到0.1的范围内，分布同样是高度右偏。这说明数据集中矮的物体占主导。

🧶非对角线图（二维散点图/热力图 - 属性间的关系）

第一列，第二行 (y vs x)。内容: 边界框中心点 (x, y) 的二维分布。颜色最深的区域（数据点最密集）位于 x 约0.2-0.6，y 约0.4-1.0 的区域。这与上面对角线直方图的观察一致：目标物体倾向于出现在图像的中下部区域。
第一列，第三行 (width vs x)。内容: 边界框宽度 width 与其中心横坐标 x 的关系。大部分点的 width 集中在0.0-0.2的窄带区域，无论 x 如何变化。图形呈现一个大致的三角形上限，这是因为当边界框中心靠近图像左右边缘时，其最大可能宽度会受到限制（例如，如果中心在 x=0.1，宽度最大只能是 0.2）。最密集的区域是小宽度物体，它们可以出现在任何 x 位置。
第一列，第四行 (height vs x)。内容: 边界框高度 height 与其中心横坐标 x 的关系。与 width vs x 类似，大部分点的 height 集中在0.0-0.1的极窄带区域。同样，由于图像边界的限制，图形整体呈现三角形上限。小高度物体可以出现在任何 x 位置。
第二列，第二行 (width vs y)。内容: 边界框宽度 width 与其中心纵坐标 y 的关系。大部分点的 width 集中在0.0-0.2。由于物体主要在图像下半部分 (y > 0.4)，所以在这个 y 值范围内，小宽度的物体很常见。图形的三角形上限表明，当边界框中心靠近图像上下边缘时，其最大宽度受限（虽然宽度主要受限于水平空间，但这里展示的是 y 坐标的关系，可能间接反映某些特定形状的物体分布）。
第二列，第三行 (height vs y)。内容: 边界框高度 height 与其中心纵坐标 y 的关系。
解读: 这个图非常清晰地展示了边界效应：当 y 接近0或1时，height 的最大值被限制为 2*min(y, 1-y)。大部分数据点集中在 height 非常小（0.0-0.1）的区域，尤其是在 y 值为0.4-1.0的范围内（物体主要分布区域）。
第三列，第三行 (height vs width)。内容: 边界框高度 height 与其宽度 width 的关系，这直接反映了物体的长宽比和尺寸。数据点极度集中在左下角（原点附近），即 width 和 height 都很小。这强烈表明数据集中绝大多数目标物体都是小尺寸的。点的分布较为发散，没有形成单一的细长条带，说明物体的长宽比具有多样性。虽然有各种长宽比，但主导趋势是小物体。

⛳综上的分析：

目标位置: 物体主要分布在图像的中下部。x 坐标分布相对均匀但略偏左和中心，y 坐标则明显偏向图像底部。

目标尺寸: 绝大多数目标都非常小，宽度和高度主要集中在0.0-0.2和0.0-0.1的范围内。
这对于YOLO模型至关重要，因为小目标检测本身就是一项挑战。模型的锚框（anchor boxes）设计需要很好地匹配这些小尺寸目标。YOLOv5/v8等版本通常会使用k-means和遗传算法根据这些标签的 width 和 height 分布自动生成锚框。
长宽比: 数据集包含多种长宽比的物体，但小尺寸是主要特征。

数据质量检查: 此图可以帮助发现标签中的潜在问题。例如，如果出现非常不符合预期的分布（比如所有物体都在图像边缘，或者尺寸完全超出预期），可能需要检查标注质量。

模型性能预期: 这种小目标为主、位置有所偏向的数据分布，会影响模型在不同区域和不同尺寸目标上的表现。可能需要在数据增强方面做特定调整，以改善模型对小目标的检测能力和泛化性。