1.1机器学习
- 定义:让计算机没有准确编程的情况下学习的研究领域
- 种类:监督学习和无监督学习
监督学习的方法:回归和分类
无监督学习:不是试图监督算法,为了给每个输入一个正确答案,而是我们需要弄懂这个模式有什么有趣的,可能有什么样的模式和结构
无监督学习的方法:聚类算法、异常检测、降维
1.聚类算法:将有标签的数据尝试将他们自动分组到集群里面
举个例子,谷歌算法每天最主要的作用就是阅读成百上千的文章,将他们是在描述一个事情或者一类事情的文章分类在一起推送给某个特定的人群。或者当你搜索关于某个明星的时候,就会出现有关这个明星的报道等
2.异常检测:人如其名,用于异常检测,例如银行账户异常、有人偷了你的钱巴拉巴拉
3.降维:压缩一个大数据集变为一个小的数据集,丢失尽可能少的信息
1.2代价函数
平方成本误差:

好了,现在你已经看到代价函数了,那么现在我们应该怎么理解他呢?
我们的目标是,尽量使得J的值最小,这样也会更加接近一个直线,

1.3.1梯度下降
梯度下降表达式:

1.3.2 学习率

α:学习率
为了更直观的看到学习率对于整个函数的影响,我们用函数图像的方式表示

如图所示,这是W的函数J的图像
当学习率过于小的时候会降低成本,但是速度非常非常慢且需要非常久的时间

当学习率过于大的时候,成本会增加,你可能会直接错过你需要的那个minimum

梯度下降算法可以用他尝试最小化任何成本函数
1.3.3 用于线性回归的梯度下降


1022

被折叠的 条评论
为什么被折叠?



