【吴恩达机器学习笔记】Part2-Week4（上）决策树（Decision Trees）

最新推荐文章于 2025-04-14 13:30:21 发布

原创

最新推荐文章于 2025-04-14 13:30:21 发布 · 1.2k 阅读

标签

#决策树 #算法

决策树

案例：修猫分类器；有一组包含猫和狗的图片数据集，根据耳朵形状（ear shape），脸的形状（face shape），胡子（whiskers）的特征判断图片上的是不是猫。
在这里插入图片描述
如果耳朵形状是尖尖的，脸的形状是圆的，那么判断为猫；
如果耳朵形状是尖尖的，脸的形状是不圆，那么判断为非猫；
如果耳朵形状是松软的，有胡子，那么判断为猫；
如果耳朵形状是松软的，无胡子，那么判断为非猫。
决策树如下图：
在这里插入图片描述
术语：
根节点（root node）：最顶端的节点；
决策节点（decision nodes）：所有决定下一步走向的节点，包括根节点；图中所有椭圆节点；
叶子结点（leaf nodes）：树最底端的节点，给出预测结果的节点；图中所有矩形节点。

1.2 学习过程

决策1：如何在每个节点处选择合适的特征/属性（How to choose what feature to split on at each node）？
纯度最大化/最小化（Maximize or minimize purity）：比如第一个节点，有三种可能的特征，但只有选择耳朵形状时，节点所分出的两个分类中，猫的占比分别最大和最小；因此选耳朵形状作为该节点的特征。
决策2：什么时候停止划分（When do you stop splitting）？

当节点获得了100%的分类结果（When a node is 100% one class）；
当划分节点会导致超过树的最大深度（When splitting a node will result in the tree exceeding a maximum depth）；
当纯度值的增长低于一定阈值（When improvements in purity score are below a threshold）；
当节点中案例数量低于一定阈值（When number of examples in a node is below a threshold）。

2.1 纯度（Measuring purity）

熵——衡量纯度的概念（Entropy as a measure of impurity）
在这里插入图片描述
如图，p1指代一组分类结果中猫的占比（剩下的是狗）；H(p1)是熵；图中为熵与p1的关系；可见熵随着纯度的增大呈现先增大后减小的趋势；在p1=0.5时（如，3个猫3个狗）熵达到最大值1，在p1分别为0（6个狗）和1（6个猫）两个端点时，熵最小，值为0。
图中熵函数的公式：
首先定义集合中除了猫之外的小动物占比：
${p_0} = 1 - {p_1}$
熵函数：
$H\left( { {p_1}} \right) = - {p_1}{\log _2}\left( { {p_1}} \right) - {p_0}{\log _2}\left( { {p_0}} \right)$