Stable but Miscalibrated: A Kantian View on Overconfidence from Filters to Large Language Models

原创于 2026-06-24 13:30:00 发布 · 87 阅读

·

2

·

标签

#语言模型 #机器学习 #人工智能

LLM Daily 专栏收录该内容

2859 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

文章核心总结与翻译

一、主要内容

本文以康德《纯粹理性批判》的认知架构为理论基础，将其重构为控制论中的状态空间反馈模型，核心探讨推理系统（从线性高斯系统到大型语言模型）的过度自信与幻觉问题，提出“认知不稳定性”是这类问题的根源。

理论重构：将康德的三重认知结构（感性-知性-理性）映射为控制论中的“观测-模型-增益调整”反馈循环，其中理性扮演“调节器”角色，通过控制闭环算子Φ=A-KH的稳定性，确保推理不超出可能经验的边界。
量化框架：提出复合不稳定性指标H-Risk，整合谱裕度、条件数、时间敏感性和创新放大率四大维度，用于量化认知不稳定性，弥补了传统输出导向型幻觉指标无法捕捉内部推理动态的缺陷。
实证验证：
- 线性高斯系统（LTI）实验：验证了即使系统满足形式稳定性（ρ(Φ)<1），H-Risk仍能有效预测过度自信误差，且自适应增益调整（类似“批判”功能）可降低不稳定性。
- 大型语言模型（LLM）实验：通过局部雅可比矩阵近似闭环算子，发现内部脆弱性与校准偏差/幻觉存在相关性；初步测试显示，轻量化批判提示对校准的影响具有条件依赖性，可能改善或恶化性能，且存在“过度反思”效应（二阶不确定性削弱置信度与正确性的对齐）。

二、创新点

跨学科融合：首次将康德批判哲学与卡尔曼滤波的闭环算子结构进行数学化

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。