目录 Jaccard系数与Jaccard距离 什么时候应该用Jaccard距离 R 语言实现方法 Jaccard系数与Jaccard距离 Jaccard 系数定义为A与B交集的大小与A与B并集的大小的比值。 Jaccard系数为相似度的指标,系数越大,相似度越高 与Jaccard系数相关的指标为Jaccard距离。 Jaccard距离为相异性的指标,系数越大,差异越大。 什么时候应该用Jaccard距离 分类变量 使用独热编码 例如比较不同对象的用药方案的相似和相异性 R 语言实现方法 d=dist(as.matrix(df_med)