吴恩达机器学习笔记第二课

最新推荐文章于 2024-12-28 16:25:21 发布

原创最新推荐文章于 2024-12-28 16:25:21 发布 · 251 阅读

·

0

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

机器学习专栏收录该内容

2 篇文章

订阅专栏

本文深入探讨了线性回归模型，包括其目标函数、梯度下降优化方法及其变种，如批量梯度下降和随机梯度下降。此外，还介绍了线性回归的解析解——正规方程，以及相关矩阵运算。内容涵盖了从模型建立到参数求解的全过程。

符号表示

假设h(x)：将输入映射到输出的函数，学习的目标是得出该函数。

$(x^{i},y^{i})$ ：第i个训练例，x是向量，表示输入；y是标量，表示输出。

训练集大小m：训练集合中有多少训练例。

特征数n：每个训练例有多少特征。

参数θ：决定h的参数

线性回归

决定θ使得预测

的误差（代价函数）

最小。

(假设x0=1)

梯度下降

不断更新θ，使得J不断趋近最小值的过程。

α为学习速度，和梯度值共同影响下降的速度。

梯度下降可以找到局部最优。

批量梯度下降

对于线性回归问题，通过代入J，可以将更新公式转化为如下形式：

该方法称为批量梯度下降（batch gradient decent）。

如果训练集大小为1，上述公式变为

称为LMS更新法则（least mean squares rule）。

批量梯度下降的好处在于它最终一定能收敛，对于线性回归问题，批量梯度下降保证收敛到全局最优。

坏处在于它比较耗时，每一步都要遍历整个训练集合。

随机梯度下降

为了解决批量梯度下降速度慢的问题，我们可以对每个训练例都使用一次LMS，直接更新θ。

这样好处就是下降速度大大加快，坏处是最终无法收敛，会在一个小范围徘徊。

正规方程

对于线性回归问题，我们其实不必用迭代算法来求解。我们有方法可以求出线性回归问题的解析解。

矩阵导和迹

对一个函数我们定义算子作用于得到新的函数为

定义函数tr：

有如下性质：

定义设计矩阵，训练集中每个训练例子组成了它的行。其中，规定第一列为1。它是一个m*(n+1)矩阵

定义目标向量，是训练例的答案

h表示为矩阵的形式：

那么

代价J可以表示：

根据性质，求得矩阵的导：

令导为0，即为最小值点：

此为线性回归的解析解。称为正规方程。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。