Softmax 函数:从原理到实现

一、Softmax 的定义与原理

Softmax 函数是一种将实数向量映射为概率分布的非线性函数,广泛应用于多分类问题的输出层。其核心思想是通过指数函数放大输入值的差异,再通过归一化得到概率。

数学公式​:

其中 z=[z1​,z2​,…,zK​] 是输入向量,K 是类别数。输出满足:

  • 每个元素 ∈(0,1)
  • 所有元素之和为 1

二、数值稳定性优化

直接计算指数可能导致数值溢出(尤其是大输入时)。改进方法是对输入向量进行平移:

减去最大值后,指数计算更稳定,且不影响输出结果。

三、梯度推导

设 ,交叉熵损失为(其中 y 是 one-hot 标签)。计算梯度 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

浩瀚之水_csdn

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值