28、机器学习中的聚类与分类模型评估

机器学习中的聚类与分类模型评估

1. 聚类模型性能提升

聚类算法能够创造新信息,其性能既取决于聚类本身的质量,也与如何利用这些信息有关。之前的分析表明,通过聚类得到的五个青少年群体为了解青少年兴趣提供了有用且新颖的见解,这意味着算法表现良好。接下来,我们要将这些见解转化为实际行动。

首先,把聚类结果应用到完整数据集上。 kmeans() 函数创建的 teen_clusters 对象包含一个名为 cluster 的组件,其中存储了样本中 30,000 个人的聚类分配信息。我们可以使用以下命令将其作为一列添加到 teens 数据框中:

teens$cluster <- teen_clusters$cluster

有了这些新数据,我们可以开始研究聚类分配与个体特征之间的关系。例如,下面是社交网络服务(SNS)数据中前五个青少年的个人信息:

teens[1:5, c("cluster", "gender", "age", "friends")]
cluster gender age friends
5 M <
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值