Critical Point ( local minima && saddle point)

最新推荐文章于 2025-08-09 17:46:50 发布

原创

最新推荐文章于 2025-08-09 17:46:50 发布 · 1.6k 阅读

·

3

·

标签

#深度学习 #机器学习 #神经网络

本文讨论了在训练深度学习模型时遇到的局部最小点(local minima)和鞍点(saddle point)，解释了它们的区别，如何通过Hessian矩阵判断类型，并强调了在遇到鞍点时更新策略的重要性。此外，文中指出局部最小点其实较少见，多数停滞可能是由于卡在鞍点。

当我们训练模型的时候，随著参数不断的 update，training 的 loss 不会再下降，但这时候的 loss 还没有到我们希望看到的样子，那很有可能是 deep network，没有发挥它完整的力量，所以 Optimization 显然是有问题的。

但是不管我们怎么 train 我们的模型，loss 迟迟不下降，就会猜想可能 loss 在下降的过程中遇到了微分为 0 的点，卡住了。每到这时，大家总会说这是 local minima 局部最小点，但是除了 local minima 以外，saddle point 鞍点也可能会造成微分为 0 。把梯度为 0 的点，我们统称 Critical Point 。

对于 local minima 和 saddle point 来说，虽然同样都是梯度为 0 ，但是：

因為如果是卡在local minima，那可能就没有路可以走了,因為四周都比较高,你现在所在的位置已经是 loss 最低的点，四周的 loss 都会比较高。
如果今天是卡在 saddle point 的话，saddle point 旁边还是有路可以让 loss 更低的。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。