问题陈述
用一个简单的例子来描述用线性回归——房价预测问题。
y表示房子的价格(单位:美元),
寻找目标函数
简而言之,我们希望找到一个目标函数(Hypothesis Function)
如果我们用线性回归来解决这个问题,就可以设h(θ)为如下形式:
接下来,就要选择一组Θ,使得hθ(x(i))的值尽可能的接近y(i)。可以采用一个代价函数(Cost Function)J(Θ)来衡量实际输出hθ(x(i))与目标输出y(i)间的误差。当这个误差最小时,就表示我们找到了一组θj(向量表示为Θ),使得hθ(x(i))最接近于y(i)。设J(Θ)形式如下:
最小化代价函数
有许多方法可以最小化代价函数J(Θ),这里介绍最常用的一种——梯度下降法(Gradient Descent)。
为了简化说明,现在考虑最简单的情况,即每个房子只有一种特征(n=1)。那么目标函数可表示为:hθ(x)=θ0+θ1x1,代价函数就只包含两个参数θ0和θ1,可表示为:J(θ0,θ1)=12m∑mi=1(hθ(x(i))−y(i))2。现在,x轴表示θ0,y轴表示θ1,z轴表示J(θ0,θ1),作图如下:
由图可知,该图的谷底是J(θ0,θ1)最小的点。如何找到这个点呢?我们可以在该图上随机选取一个点,求该点的斜率,沿斜率下降(注意:沿斜率下降,也就是朝导数的反方向走),每次下降的步长由学习率α决定。当下降到下一个点后,重复以上步骤,就可以逼近最低点。梯度下降法的公式表示如下:
其中,j=0,1,利用该公式迭代至收敛,求得的θ0,θ1就能够使J(θ0,θ1)最小。对于线性回归而言,该公式又可具体表述如下:
迭代至收敛{
}
如果目标函数中包含有更多的特征,即j>1。只需要根据梯度下降法的公式代入对应的偏导,并分别对θj更新即可。
最后,我们把通过梯度下降法求得的最小化代价函数Jmin(θj)所对应的所有θj代入目标函数h(θ),就可以对一个未知房价的房子进行房价预测了。
这篇博客介绍了机器学习中的线性回归,通过房价预测问题阐述问题陈述,详细讲解了寻找目标函数的过程,并重点讨论了使用梯度下降法最小化代价函数的方法,最终目的是通过线性回归模型对未知房价进行预测。
——线性回归(Linear Regression)&spm=1001.2101.3001.5002&articleId=50549153&d=1&t=3&u=a1ced6d9517042e3908b4959d5ff0d6e)
2080

被折叠的 条评论
为什么被折叠?



