机器学习,顾名思义就是让机器自己去学习,那么机器是怎样学习的呢? 机器能做的事情无非就是计算,通过计算能到合适的参数从而完成特定任务.
让机器学习,首先是要有数据,让机器从这些数据中找到规律从而完成预测
几个概念:
1. 训练集与测试集:
将数据分成两部分
一部分用于机器的训练,即让机器从这些数据中获取合适的参数,构建出模型, 这些数据称为训练集
另一部分用于机器训练出来的模型进行预测,根据一些指标来判断模型的好坏,这些数据称为测试集
2. 分类问题与回归问题:
分类: 预测的结果是离散值 例如明天是否会下雨, 肿瘤是良性或者是恶性
回归: 预测的结果是连续值 例如根据房子面积、位置预测房价, 明天的温度
3. 过拟合与欠拟合
过拟合: 得到的模型在训练集上效果过于的好,导致在测试集上效果不好
欠拟合: 得到的模型在训练集上效果不好,显然在测试集上效果也不好
4. 特征(Features)与目标(Label)
三明距离市中心2km的碧桂园一间单元房100平方米, 总售价80W
市中心2km 100平方米可以 看做特征
总售价80W 可以看做目标
5. 监督学习与无监督学习
将有目标值的数据进行学习称为监督学习
将没有目标值的数据进行学习称为无监督学习
小白一枚,纯粹个人记录
本文介绍了机器学习的基础知识,包括如何利用数据让机器学习、训练集与测试集的概念、分类与回归问题的区别、过拟合与欠拟合的解释,以及特征与目标的定义。此外,还探讨了监督学习与无监督学习的不同。

7332

被折叠的 条评论
为什么被折叠?



