DATE: 2016.9.22
文章目录
1、基本思想:
采用测量不同特征值之间的距离方法进行分类。选择k个最相似数据中出现次数最多的分类,作为新数据的分类。
2、KNN属于有监督学习算法。
改善KNN搜索的方法:K d-tree
KNN规则只需要:
- 一个整数K
- 一系列分类好的样本(训练集)
- 距离度量:最基本的KNN采用距离度量采用的是欧几里得距离。
3、分析:
下图中,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于红色三角形所占比例为2/3,绿色圆将被赋予红色三角形那个类,如果K=5,由于蓝色四方形比例为3/5,因此绿色圆被赋予蓝色四方形类。

K 最近邻 (k-Nearest Neighbor,KNN) 分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一,1968年由 Cover 和 Hart 提出。该方法的思路是:如果一个样本在特征空间中的 k 个最相似即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN 算法中,所选择的邻居都是已经正确分类的对象。该方法在分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 K 最近邻 (k-Nearest Neighbor,KNN) 分类
超级会员免费看
K-近邻算法(KNN)是一种基于距离度量的有监督学习方法,用于分类和回归。它根据最近的K个邻居的多数类别决定新样本的归属,K值的选择和距离度量对结果影响较大。KNN算法简单有效,但计算复杂度高,对样本不平衡问题敏感。适用场景主要是样本容量较大的类域分类。
订阅专栏 解锁全文
804

被折叠的 条评论
为什么被折叠?



