Softmax 回归

回归 vs 分类
-
回归估计一个连续值
-
分类预测一个离散类别

应用:Kaggle上的分类问题
-
将人类蛋白质显微镜图片分成28类

-
将恶意软件分成9个类别

-
将恶意的Wikipedia评论分成7类

从回归到多类分类
回归
-
单连续数值输出
-
自然区间
ℝ -
跟真实值的区别作为损失

分类
-
通常多个输出
-
输出
i是预测为第i类的置信度(置信度=可信度)
从回归到多类分类——均方损失
-
对类别进行一位有效编码

-
使用均方损失训练
-
最大值最为预测

从回归到多类分类——无校验比例
-
对类别进行一位有效编码
-
最大值最为预测

-
需要更置信的识别正确类(大余量)

从回归到多类分类——校验比例
-
输出匹配概率(非负,和为1)

-
概率
y和ŷ的区别作为损失
Softmax和交叉熵损失
-
交叉熵常用来衡量两个概率的区别

-
将它作为损失

-
其梯度是真实概率和预测概率的区别

总结
- Softma回归是一个多类分类模型
- 使用Softmax操作子得到每个类的预测置信度
- 使用交叉熵来衡量预测和标号的区别
损失函数

均方损失函数(L2 Loss)
公式:

图:

蓝色:当y=

本文介绍了softmax回归在多类分类中的应用,从回归转换到分类,探讨了不同的损失函数,如均方损失、无校验比例和校验比例,以及softmax和交叉熵损失。通过实例展示了如何在Fashion-MNIST数据集上实现和训练softmax回归模型,最后实现了模型的预测功能。

4130

被折叠的 条评论
为什么被折叠?



