评估无监督学习算法
无监督学习算法不做出预测,也不存在 y 值,因此无法直接根据模型预测的准确率进行评估。以聚类算法为例,我们虽然使用“肘部法则”来做目测,但还是需要一个统计量。轮廓系数(silhouette coefficient) 是一个表示聚类分离的变量,取值在 -1 到 1 之间,可以用来定性地分析聚类算法的优度。
代码
在 Python 和 scikit-learn 中计算轮廓系数的代码如下:
attributes = tabular_data
cluster_labels = outputted_labels_from_clustering
from sklearn.metrics import silhouette_score
silhouette_score(attributes, cluster_labels)

3569

被折叠的 条评论
为什么被折叠?



