1.KNN算法
KNN算法的定义,简单来说就是通过计算未知样本与所有样本之间的距离,以最近邻者的类别作为决策位置样本类别的唯一依据。
KNN是一种典型的分类算法,因其简单高效在世界范围内受到广泛应用。
但是KNN同样有很多缺点,比如对内存要求较高,容易受到噪声干扰等等。
2.kmeans算法
kmeans算法的定义:给定K值和K个初始类簇中心点的情况下,把每个点(亦即数据记录)分到离其最近的类簇中心点所代表的类簇中,所有点分配完毕之后,根据一个类簇内的所有点重新计算该类簇的中心点(取平均值),然后再迭代的进行分配点和更新类簇中心点的步骤,直至类簇中心点的变化很小,或者达到指定的迭代次数。
kmeans的缺点也很明显,选择的K值不好把握,并且因为是采取迭代的方法,很容易得到的是局部最优解。
3.区别
1.类型区别
KNN是分类算法,在分类之前已经有学习对象,属于监督学习;而k-means算法是聚类算法,属于无监督学习。
2.学习对象区别
KNN所学习的内容都是带有label的对象,是完全正确的对象;
kmeans所学的内容是无label的对象,需要先将其分类,再进行学习。
本文详细介绍了KNN和K-means两种机器学习算法,KNN为一种监督学习的分类算法,通过计算未知样本与所有样本之间的距离来确定样本类别;K-means则是一种无监督学习的聚类算法,通过迭代将数据记录分到最近的类簇中心点所代表的类簇中。

5499

被折叠的 条评论
为什么被折叠?



