YOLO说“这是一辆车，置信度0.85“——凭什么？KAN网络把置信度拆成7个可解释因素

原创已于 2026-03-27 14:15:42 修改 · 581 阅读

11 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#YOLO #网络 #人工智能 #计算机视觉 #车辆检测

于 2026-03-27 14:11:53 首次发布

导读

YOLO系列检测器能给出目标的边界框和置信度分数，但一个根本问题长期缺乏系统性回答：这个置信度到底是怎么来的？什么情况下它不值得信任？本文提出一个事后可解释性框架，用Kolmogorov-Arnold网络（KAN）作为YOLOv10的代理模型，将检测置信度拆解为7个可解释特征的函数。

实验显示代理模型对原始置信度的拟合R²达到0.9957，并揭示了一个关键发现：类别（cls）和原始置信度（conf）是驱动模型行为的两大因素，而边界框的几何位置（x, y, w, h）影响很弱。更实用的是，在遮挡、杂乱等挑战场景中，KAN能准确标记出置信度不可靠的检测——例如一辆被树遮挡的车，YOLO给出0.25的置信度，KAN将其修正为0.07，差值达-0.18。本文还引入BLIP视觉语言模型为检测场景生成自然语言描述，构成从数值到语义的完整可解释链条。

论文信息

标题：YOLOv10 with Kolmogorov-Arnold networks and vision-language foundation models for interpretable object detection and trustworthy multimodal AI in computer vision perception
作者：Marios Impraimakis（通讯作者）, Daniel Vazquez, Feiyu Zhou
机构：University of Bath（英国）、Zhejiang University（中国）
论文编号：2603.23037

四、挑战场景中的置信度校准：KAN如何标记不可靠检测

五、总结与思考

一、YOLO的置信度是个"黑箱数字"

目标检测模型输出的置信度分数，是实际部署中做决策的核心依据——自动驾驶中判断是否有行人、工业质检中判断是否有缺陷，都依赖这个数字。但现有YOLO系列模型对置信度的生成过程是不透明的：用户拿到一个0.85的置信度，无法知道这个数字主要由目标的类别决定，还是由目标的大小、位置决定，更无法判断在什么条件下这个数字会失真。

这个问题在两类场景中尤其严重：一是安全敏感场景（如自动驾驶），需要知道模型"不确定"的时候在哪里；二是模型调优场景，工程师需要理解置信度偏低的原因是模型能力不足还是输入数据的固有困难。

本文的出发点不是提升检测精度，而是建立一套可解释性框架来回答：YOLOv10的置信度由哪些因素驱动？每个因素的影响方向和强度是什么？何时置信度不可信？

二、三层架构：检测、解释、描述

本文提出的框架由三个模块串联构成：

图片来源于原论文

第一层：YOLOv10检测器。输入640×640图像，输出约8400个候选检测，每个检测包含边界框坐标、置信度分数和类别预测。这一层直接使用预训练的YOLOv10，不做任何修改。

第二层：KAN代理模型（Kolmogorov-Arnold Network）。这是本文的核心贡献。KAN接收每个检测的7个特征作为输入，输出对置信度的可解释近似值。这7个特征分别是：

特征	含义
x, y	边界框中心的归一化坐标
w, h	边界框的归一化宽度和高度
conf	YOLOv10输出的原始置信度
cls	预测类别的索引值
scale	相对图像尺度（w×h / 640²）

KAN的网络架构为 [7, 16, 1]，即7个输入、16个隐藏神经元、1个输出。与传统MLP使用固定激活函数不同，KAN的每条连接边上都是一个可学习的B样条函数（三次B样条，Grid=5），总计128条可学习的样条曲线。这种设计源自Kolmogorov-Arnold表示定理：任何多元连续函数都可以表示为一元连续函数的有限叠加。因此，KAN天然地将多变量函数分解为单变量函数的组合，使得每个输入特征对输出的影响可以单独可视化和分析。

第三层：BLIP视觉语言模型。为每个检测场景生成自然语言描述（如"a red truck parked in front of a house"），将数值层面的可解释性扩展到语义层面。

三、KAN揭示了什么：置信度的驱动因素

代理模型的保真度

KAN代理模型在9098个检测样本上的拟合质量：Overall R²=0.9957，MAE=0.0109，RMSE=0.0151。论文报告的分特征分桶结果显示各桶R²均在0.99以上，MAE在0.015以下。R²接近1说明KAN以高保真度复现了YOLOv10的置信度行为，可以作为可靠的解释代理。

特征重要性分析

论文使用了四种互补的可解释性度量来分析每个特征的影响。以下数据来自论文的统一特征影响力表（Table 4）：

特征	SplineActivation	Saliency	PD Delta	Influence
x	0.107	2.86×10⁻⁶	-0.008	0.017
y	0.106	5.29×10⁻⁶	-0.025	0.014
w	0.062	8.34×10⁻⁶	0.057	0.042
h	0.069	4.70×10⁻⁶	-0.046	0.004
conf	0.191	2.12×10⁻⁴	0.707	0.520
cls	3.732	3.33×10⁻⁶	0.030	0.526
scale	0.083	5.55×10⁻⁶	-0.027	0.011

关键发现：

cls（类别）在SplineActivation和Influence两个指标上均为最高（3.732和0.526），说明YOLOv10的置信度行为在不同类别之间存在显著差异——对某些类别天然给出更高的置信度。
conf（原始置信度）在Saliency和PD Delta上为最高（2.12×10⁻⁴和0.707），且Influence也达到0.520，是另一个核心驱动因素。
几何特征（x, y, w, h, scale）在所有指标上的影响均较弱，说明目标在图像中的位置和大小对置信度的影响有限。

单调性分析

部分依赖（Partial Dependence）分析进一步揭示了每个特征对置信度的影响方向：

特征	单调性得分	方向	强度
x	0.022	平坦/弱	弱
y	0.034	平坦/弱	弱
w	0.377	正向	中等
h	0.449	正向	中等
conf	0.997	正向	强
cls	-0.146	负向	弱
scale	0.023	平坦/弱	弱

conf的单调性得分达到0.997，接近完全正相关，表明KAN代理模型忠实地保持了"原始置信度越高→代理输出越高"的关系。w和h呈中等正向单调性——更大的目标倾向于获得更高的置信度。

图片来源于原论文

隐藏单元的功能分工

论文分析了16个隐藏神经元各自与哪些输入特征关联最强。结果显示，16个隐藏神经元中多数与cls特征的相关系数接近±1.0（如n0的相关系数为0.9997，n1为-0.9997），少数神经元（如n9）专注于conf特征（相关系数-0.9587）。论文认为这种分布表明KAN内部存在功能分工，不同神经元"负责"解释不同的输入维度。

四、挑战场景中的置信度校准：KAN如何标记不可靠检测

论文在COCO数据集和University of Bath校园实拍图像上进行了验证，尤其关注挑战场景中的表现：

高质量场景：在清晰的货车、警车、沙地车等场景中，KAN代理模型输出的置信度与YOLOv10原始置信度高度一致，差值接近0。这说明在常规条件下，YOLOv10的置信度是可信的。

挑战场景：在遮挡、杂乱背景等条件下，KAN能够有效标记出置信度不可靠的区域：

遮挡场景：一辆被树部分遮挡的车，YOLOv10给出置信度0.25，KAN将其修正为0.07，差值为-0.18。KAN通过分析7个特征的联合模式，识别出这是一个低信任检测。
杂乱背景场景：背景干扰严重时，KAN同样能标记出置信度偏高的虚检。

图片来源于原论文

这种差值（Delta）本身就构成了一个实用的信号：当KAN输出与YOLO原始输出的差距较大时，提示该检测结果需要人工复核或额外验证。

此外，BLIP为每个场景生成的自然语言描述（如"a red truck parked in front of a house"）为非技术用户提供了直观的场景理解，使得整个可解释性链条从数值分析延伸到语义层面。

五、总结与思考

本文的核心贡献不在于检测精度的提升，而在于为YOLO类检测器建立了一套事后可解释性分析框架。通过KAN代理模型，将"黑箱"的置信度分数拆解为可分析的特征影响，回答了"置信度从哪来"和"何时不可信"两个实际部署中的关键问题。

值得关注的几个点：

KAN的选择有理论优雅性。Kolmogorov-Arnold表示定理保证了多元连续函数可以被分解为一元连续函数的有限叠加，这与"逐个分析每个特征影响"的可解释性目标天然匹配。相比于用传统MLP做代理模型，KAN的可学习B样条函数本身就是可视化的——每条样条曲线直接展示了一个特征对输出的映射关系。
发现的实用价值。"cls和conf是置信度主驱动因素，几何特征影响弱"这个结论，对工程实践有直接指导意义：如果某个类别的检测置信度系统性偏低，问题更可能出在训练数据的类别分布上，而非图像中目标的大小或位置。
局限性方面，论文目前仅在车辆检测任务上做了验证，7个输入特征的选取也是针对该场景的。对于更复杂的多类别检测、小目标密集场景，特征重要性的分布可能不同，代理模型的架构是否需要调整尚待验证。此外，KAN代理模型是事后训练的，它解释的是YOLOv10已有的行为模式，而非改善这些行为。