1. 连续型特征的常用的归一化方法、离散型特征one-hot编码的意义
2. 度量特征之间的相关性 :余弦相似度和皮尔逊相关系数
本文探讨了连续型特征的归一化方法,如Z-score和Min-Max缩放,以及离散型特征通过One-hot编码的重要性。同时,介绍了余弦相似度和皮尔逊相关系数在衡量特征间相关性上的应用,帮助理解特征选择和数据预处理在机器学习中的关键作用。
401
329

被折叠的 条评论
为什么被折叠?
