共轭梯度法(Conjugate Gradient)是介于最速下降法与牛顿法之间的一个方法,它仅需利用一阶导数信息,但克服了最速下降法收敛慢的缺点,又避免了牛顿法需要存储和计算Hesse矩阵并求逆的缺点,共轭梯度法不仅是解决大型线性方程组最有用的方法之一,也是解大型非线性最优化最有效的算法之一。
以上参考百度百科的共轭梯度法,但是一开始没看明白,结合《数值分析》中的一些解释,结合自己的理解,算是大概弄明白了。
wikipedia关于共轭梯度法描述的比较清晰。
一 什么是A共轭?
令A是对称正定的n*n矩阵,对于n维的列向量v和w,定义A内积为:
当时,称列向量v和w为A共轭。
特别的,当时,
二 共轭梯度法的伪代码分析
共轭梯度直接法主要作用是求解Ax=b的精确解,但是如果b的维数较高,直接法会消耗大量时间。而共轭梯度法作为迭代方法的话,对于求解高维问题的逼近解或稀疏解是很有用的,我们可以用部分的梯度方向去获得一个符合要求的逼近解,这样可以缓解直接共轭梯度方法的耗时问题。
我们构造,问题是求解Ax=b。也就是令
为0,那么对
积分,可得到二次泛函:
![]()
那问题也就转向了求f(x)的极小值点问题。我们知道,当多元函数的二次倒数也就是黑塞矩阵是正定的时候,那么驻点就是极小值。因此要求:为正定的。
为了求f(x)的最小值,只要我们一步一步得使趋近于0即可。假设x的值是x0,那么梯度的误差为:
,因此我们要往反方向缩小误差。取初始的方向为
,同时,p0也是残差。
令第k步的残差为
如何找函数f(x)下降最快的方向:



这里

&spm=1001.2101.3001.5002&articleId=88088279&d=1&t=3&u=6249a87d16ab42afba367083829f7087)
9323

被折叠的 条评论
为什么被折叠?



