决策树或随即森林
- 中位数(数值型)或众数(类别型)
- 使用其他的训练数据的相应特征做加权补充
xgboost的方法
分叉时先不考虑缺失值,分好之后分别计算把缺失值放到左面和右面的损失,选择小的作为缺失值分类方向。
本文探讨了多种处理数据集中缺失值的有效方法,包括使用决策树、随机森林预测缺失值,利用中位数或众数填充,以及XGBoost等高级算法处理策略。特别介绍了分叉时不考虑缺失值,在节点划分后再确定缺失值归属的方法。
分叉时先不考虑缺失值,分好之后分别计算把缺失值放到左面和右面的损失,选择小的作为缺失值分类方向。
697

被折叠的 条评论
为什么被折叠?
