解读ultralytics框架训练YOLO输出的labels.jpg和labels_correlogram.jpg以及对results.csv中的内容进行可视化

该文章已生成可运行项目,

📌使用ultralytics框架训练YOLO在runs/detect/train下会有labels.jpg、labels_correlogram.jpg和results.csv文件生成。

🥯下图是labels.jpg

  • 左上角是训练集中每个类别的实例数,也就是这个类别的所有训练集的图像上出现过多少次,可以明显看出数据集中类别分布非常不均衡,可以为后续了解各类缺陷的样本数量,为数据增强、模型选择(例如,是否需要处理类别不平衡问题)提供依据;
  • 右上角是展示了所有类别检测框(bounding boxes)以图像中心为原点对齐并叠加的效果。不同颜色(与左上角的图对应)的框代表不同类别的缺陷。大部分框呈现为横向较长的矩形,说明很多缺陷(或井盖)在图像中是扁平的。也存在一些接近正方形的框。框的尺寸差异较大,有很小的框,也有几乎覆盖大部分图像区域的框。中心区域框的密度最高,颜色也最深(蓝色和深色框),表明许多框的中心点都接近图像中心,并且这些框的尺寸和形状有重叠。可以直观了解各类缺陷边界框的形状、尺寸和大致位置分布,有助于设计合适的锚框(anchor boxes)(针对于anchor-based的网络)或目标检测模型;
  • 左下角是中心点相对于整幅图的位置。x 和 y 轴分别表示缺陷在图像中的归一化坐标(0到1),颜色的深浅表示该位置出现缺陷的频率或密度。中心密集:最深的颜色集中在图像的中心区域(大约 x=0.4-0.6, y=0.4-0.6)。这表明绝大多数缺陷或关注对象(如井盖)倾向于出现在图像的中心。向外逐渐稀疏:从中心向四周,颜色逐渐变浅,说明离图像中心越远,缺陷出现的频率越低。整体分布:缺陷的分布在x和y方向上都呈现出类似正态分布的趋势,中心高,两边低。可以进一步分析缺陷或目标在图像中的空间位置偏好。如果目标总是集中在中心,可以据此优化检测算法的搜索区域;
  • 右下角是图中目标相对于整幅图的高宽比例。width 和 height 分别代表缺陷边界框的归一化宽度和高度,颜色的深浅表示具有特定宽度和高度组合的框的出现频率。主要集中区域:在左下角有一个非常密集的区域(颜色最深),对应于宽度较小、高度也较小的框。沿着 width 轴,当 height 较小时(例如 height < 0.1),可以看到一些密度较高的点,表明存在不少宽度较大但高度较小的扁平框。这可能对应于横向裂缝、一些修补或者是扁平的井盖。分散区域:除了集中的区域,还有很多零散的点分布在较大的宽度和高度范围内,说明数据集中也存在各种尺寸的大型缺陷或物体。形状趋势:总体来看,矮而宽的框(height 小, width 大)以及小尺寸的框(width 和 height 都小)似乎是比较常见的。可以进一步分析缺陷边界框的尺寸和长宽比分布。这对于目标检测中的锚框设计、尺度变换等非常重要。例如,根据这个分布可以设计出更匹配数据特征的锚框尺寸和比例(前提是在有anchor的模型前提下)。

🎨下图是labels_correlogram.jpg

它显示了数据集中标注框(labels)的几个关键属性之间的相关性。这些属性通常包括边界框的中心点坐标 x、y,以及边界框的宽度 width 和高度 height,这些值都经过了归一化处理(范围在0到1之间)。矩阵的对角线上是各个属性的一维直方图,显示了该属性自身的数据分布。非对角线上的图是两个不同属性之间的二维散点图(或二维直方图/热力图),显示了它们之间的关系,颜色越深表示数据点越密集。

🔢对角线图(一维直方图 - 各属性的分布)

  • 最顶部的直方图 (对应第一列 x): 这是 x (中心点横坐标) 的分布。看起来 x 的分布相对均匀,横跨0到1,可能在0.2到0.6之间略微密集一些。这表明目标物体在图像的水平方向上没有特别集中的区域,但可能稍微偏向图像的左半部分到中心。
  • 第二行对角线上的直方图 (对应第二列 y): 这是 y (中心点纵坐标) 的分布。y 的值主要集中在0.4到1.0之间,且密度向1.0递增。这表明大多数目标物体的中心位于图像的下半部分(假设图像坐标系(0,0)在左上角)。
  • 第三行对角线上的直方图 (对应第三列 width): 这是 width (边界框宽度) 的分布绝大多数边界框的宽度都非常小,集中在0.0到0.2的范围内,然后迅速减少。这是一个典型的右偏分布,说明数据集中小宽度物体占主导。
  • 第四行对角线上的直方图 (对应第四列 height): 这是 height (边界框高度) 的分布。与宽度类似,绝大多数边界框的高度也非常小,主要集中在0.0到0.1的范围内,分布同样是高度右偏。这说明数据集中矮的物体占主导

🧶非对角线图(二维散点图/热力图 - 属性间的关系)

  • 第一列,第二行 (y vs x)。内容: 边界框中心点 (x, y) 的二维分布。颜色最深的区域(数据点最密集)位于 x 约0.2-0.6,y 约0.4-1.0 的区域。这与上面对角线直方图的观察一致:目标物体倾向于出现在图像的中下部区域。
  • 第一列,第三行 (width vs x)。内容: 边界框宽度 width 与其中心横坐标 x 的关系。大部分点的 width 集中在0.0-0.2的窄带区域,无论 x 如何变化。图形呈现一个大致的三角形上限,这是因为当边界框中心靠近图像左右边缘时,其最大可能宽度会受到限制(例如,如果中心在 x=0.1,宽度最大只能是 0.2)。最密集的区域是小宽度物体,它们可以出现在任何 x 位置。
  • 第一列,第四行 (height vs x)。内容: 边界框高度 height 与其中心横坐标 x 的关系。与 width vs x 类似,大部分点的 height 集中在0.0-0.1的极窄带区域。同样,由于图像边界的限制,图形整体呈现三角形上限。小高度物体可以出现在任何 x 位置。
  • 第二列,第二行 (width vs y)。内容: 边界框宽度 width 与其中心纵坐标 y 的关系。大部分点的 width 集中在0.0-0.2。由于物体主要在图像下半部分 (y > 0.4),所以在这个 y 值范围内,小宽度的物体很常见。图形的三角形上限表明,当边界框中心靠近图像上下边缘时,其最大宽度受限(虽然宽度主要受限于水平空间,但这里展示的是 y 坐标的关系,可能间接反映某些特定形状的物体分布)。
  • 第二列,第三行 (height vs y)。内容: 边界框高度 height 与其中心纵坐标 y 的关系。
  • 解读: 这个图非常清晰地展示了边界效应:当 y 接近0或1时,height 的最大值被限制为 2*min(y, 1-y)。大部分数据点集中在 height 非常小(0.0-0.1)的区域,尤其是在 y 值为0.4-1.0的范围内(物体主要分布区域)。
  • 第三列,第三行 (height vs width)。内容: 边界框高度 height 与其宽度 width 的关系,这直接反映了物体的长宽比和尺寸。数据点极度集中在左下角(原点附近),即 width 和 height 都很小。这强烈表明数据集中绝大多数目标物体都是小尺寸的。点的分布较为发散,没有形成单一的细长条带,说明物体的长宽比具有多样性。虽然有各种长宽比,但主导趋势是小物体。

⛳综上的分析:

  • 目标位置: 物体主要分布在图像的中下部。x 坐标分布相对均匀但略偏左和中心,y 坐标则明显偏向图像底部。
  • 目标尺寸: 绝大多数目标都非常小,宽度和高度主要集中在0.0-0.2和0.0-0.1的范围内。
  • 这对于YOLO模型至关重要,因为小目标检测本身就是一项挑战。模型的锚框(anchor boxes)设计需要很好地匹配这些小尺寸目标。YOLOv5/v8等版本通常会使用k-means和遗传算法根据这些标签的 width 和 height 分布自动生成锚框。
  • 长宽比: 数据集包含多种长宽比的物体,但小尺寸是主要特征。
  • 数据质量检查: 此图可以帮助发现标签中的潜在问题。例如,如果出现非常不符合预期的分布(比如所有物体都在图像边缘,或者尺寸完全超出预期),可能需要检查标注质量。
  • 模型性能预期: 这种小目标为主、位置有所偏向的数据分布,会影响模型在不同区域和不同尺寸目标上的表现。可能需要在数据增强方面做特定调整,以改善模型对小目标的检测能力和泛化性。

🔦results.csv里面主要包括了YOLO各类任务训练的epoch、time、trian的loss、val的loss等,可以进行可视化作图查看。具体代码请查看我的另一篇博客!

使用ultralytics框架训练模型后可视化结果_ultralytics训练结果可视化-CSDN博客文章浏览阅读142次。用ultralytics框架训练模型后会在runs/detect下生成关于训练相关的权重等文件,里面会有metrics和loss的结果图,不过他们是分开可视化,有时候需要把他们会在同一幅图上去分析和观察,那么可以从results.csv文件中选择需要的指标去可视化_ultralytics训练结果可视化 https://blog.csdn.net/Jacknbv/article/details/147719699?spm=1001.2014.3001.5501

本文章已经生成可运行项目
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

悠悠海风

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值