李航老师《统计学习方法》第十四章聚类方法课后题答案

这篇博客深入探讨了分裂聚类算法的自上而下实现及其时间复杂度,证明了类定义之间的相互推导,并展示了k均值算法解的指数级数量。同时,对比了k均值聚类与高斯混合模型在EM算法下的异同,指出两者在应用场景和收敛性上的特点。

其他章节答案请参考我的汇总统计学习方法答案汇总,都是自己写的。

1、试写出分裂聚类算法,自上而下地对数据进行聚类,并给出其算法复杂度。

解:
算法流程大致如下:
输入:数据集T,指定需要划分的簇数k
输出:k个数据集的子集

  1. 将数据集T中的所有样本作为一个初始簇。
  2. 在所有的簇中选择直径最大的簇记为 C 0 C_0 C0
  3. 计算簇 C 0 C_0 C0中所有的点到其他点的平均距离最大的点 p 0 p_0 p0放在一个新的簇 C n e w C_{new} Cnew中, C 0 C_0 C0中剩余的样本构成的簇记为 C o l d C_{old} Cold
  4. 然后重复一下过程:对 C o l d C_{old} Cold中的点 x x x,如果 x x x C n e w C_{new} Cnew的距离比 x x x C o l d C_{old} Cold中距离 x x x最近的点的距离要小,那么就将点 x x x放在新的簇 C n e w C_{new} Cnew中,除了点
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值