文章目录
线性回归:预测一个连续的值
逻辑回归:预测一个离散的值
逻辑回归的引入


当我们要做二分类的时候,我们一般只希望得到两个值 y = 0 或 1
但是, 线性回归得到的值是在一个范围内的连续值,而且可能远 > 1 或远 < 0
这样会给分类带来困难,我们希望的值域:







决策边界


逻辑回归的损失函数
线性回归的做法是:损失函数

那么逻辑回归的损失函数怎么确定呢?
熵的引入
熵的意义:
热力学上: 熵是一种测量分子不稳定的指标,分子运动越不稳定,熵就越大
信息论(香农): 熵是一种测量信息量的单位,信息熵,包含的信息越多,熵就越大。
机器学习: 熵是一种测量不确定性的单位,不确定性越大,概率越小,熵就越大!
信息量:
事件A:德国队进入了2018世界杯决赛圈
事件B:中国队进入了2018世界杯决赛圈
越不可能的事件发生了,我们获取到的信息量

这篇博客介绍了逻辑回归在二分类问题中的应用,强调了决策边界的设定。通过熵和交叉熵的概念,详细解释了逻辑回归的损失函数。此外,文章还探讨了梯度下降法,并引入K折交叉验证作为评估模型性能的指标。最后,提供了代码实现来辅助理解。

9793

被折叠的 条评论
为什么被折叠?



