弱监督学习 (Weakly Supervised Learning，WSL)

最新推荐文章于 2026-05-05 09:24:09 发布

原创最新推荐文章于 2026-05-05 09:24:09 发布 · 1.4k 阅读

本内容遵循CC 4.0 BY-SA版权协议

标签

#学习 #深度学习 #人工智能

50 篇文章

订阅专栏

利用不完整、不精确或不准确的弱标签训练模型，以解决高质量标注稀缺且昂贵的核心问题。

一原因与挑战

（1）标注成本瓶颈：监督学习依赖大量标注，成本高。

（2）弱标签优势：图像级标签代替物体框。

（3）挑战：噪声干扰（标签错误）；信息模糊（缺乏细粒度定位）；模型易过拟合弱信号。

特点：少量标注+大量无标注数据

核心方法：

（1）半监督学习 (Semi-Supervised Learning)：

自训练 (Self-training)：初始模型预测无标注数据 → 高置信度样本加入训练集 → 迭代优化。

一致性正则化 (Consistency Regularization)：对同一样本添加扰动（噪声/Dropout），强制输出相似。

熵最小化：鼓励模型对无标注数据输出高置信度预测。

（2）主动学习 (Active Learning)：模型主动选择"信息量最大"的样本交给人标注。

特点：标签存在但粒度粗糙

核心方法：

（1）多示例学习 (Multi-Instance Learning, MIL)：

包 (Bag) 级别标签 → 实例 (Instance) 级预测。标准假设：包为正 ⇔ 至少含一个正实例。

（2）弱监督目标检测/分割：

Class Activation Mapping (CAM)：利用卷积特征图定位目标（Grad-CAM 提供更优可视化）。PRM (Pixel-Region Matching)：对齐图像级标签与区域特征生成分割掩码。

特点：标签含噪声或错误

核心方法：

（1）噪声鲁棒损失函数：

对称交叉熵 (Symmetric Cross Entropy)：双向惩罚预测与标签偏差；

广义交叉熵 (GCE)：平衡 CE 和 MAE 优点；

Bootstrapping：融合模型预测与原始标签。

（2）噪声样本处理：

小损失技巧：训练后期丢弃损失小的样本（可能是正确标签或简单样本）；

Co-teaching：双模型互相清洗噪声样本；

标签修正：训练过程中动态更新噪声标签。