从混淆矩阵到mIOU：用Python代码拆解语义分割评估陷阱

最新推荐文章于 2026-06-22 23:34:34 发布

原创

最新推荐文章于 2026-06-22 23:34:34 发布 · 166 阅读

标签

#语义分割 #mIOU #深度学习 #类别不平衡

从混淆矩阵到mIOU：Python实战解析语义分割评估的数学本质与陷阱规避

当你在医学影像中标注肿瘤区域时，模型输出的mIOU高达90%，但实际查看预测结果却发现肿瘤区域几乎全被漏检——这种"高分低能"现象背后，是类别不平衡数据对评估指标的隐性扭曲。本文将用NumPy从零实现混淆矩阵计算全流程，揭示mIOU在极端类别分布下的失真机制，并给出可复现的解决方案。

1. 语义分割评估的核心：混淆矩阵的数学本质

混淆矩阵（Confusion Matrix）是理解所有分割指标的基础。这个看似简单的N×N矩阵（N为类别数）实际上构建了一个预测与真实标签的联合概率空间。对于语义分割任务，每个像素的分类结果都可以映射到这个矩阵的某个位置。

关键数学原理：混淆矩阵的行方向（垂直）表示真实类别分布，列方向（水平）体现模型预测倾向。主对角线上的值代表正确分类的像素数，而非对角线元素则揭示了模型特定的混淆模式。例如在肺部CT分割中，血管和支气管的交叉区域常出现相互误判。

用Python实现混淆矩阵时，最优雅的方式是利用numpy的bincount函数。以下代码展示了如何将二维的预测结果和标签映射为一维索引，再重组为混淆矩阵：

def compute_confusion_matrix(pred, label, num_classes):
    mask = (label >= 0) & (label < num_classes)
    hist = np.bincount(
        num_classes * label[mask].astype(int) + pred[mask],
        minlength=num_classes**2
    ).reshape(num_classes, num_classes)
    return hist

这段代码的精妙之处在于：