- 连续值处理
之前讨论的决策树是属性的取值都是有限个数,都是离散的,对于连续值,需要使用离散化技术,最简单的就是使用二分法。
![]()


- 缺失值处理
我们可能会遇到样本的某些属性值缺失的情况,这时候我们需要对不完整样本进行处理。


这三个数值用来在信息增益中作为权重。

之前讨论的决策树是属性的取值都是有限个数,都是离散的,对于连续值,需要使用离散化技术,最简单的就是使用二分法。
![]()


我们可能会遇到样本的某些属性值缺失的情况,这时候我们需要对不完整样本进行处理。


这三个数值用来在信息增益中作为权重。

1901
2514
2370

被折叠的 条评论
为什么被折叠?
