【吴恩达机器学习笔记】Part2-Week4(上) 决策树(Decision Trees)

目录

1.1 决策树模型

案例:修猫分类器;有一组包含猫和狗的图片数据集,根据耳朵形状(ear shape),脸的形状(face shape),胡子(whiskers)的特征判断图片上的是不是猫。
在这里插入图片描述
如果耳朵形状是尖尖的,脸的形状是圆的,那么判断为猫;
如果耳朵形状是尖尖的,脸的形状是不圆,那么判断为非猫;
如果耳朵形状是松软的,有胡子,那么判断为猫;
如果耳朵形状是松软的,无胡子,那么判断为非猫。
决策树如下图:
在这里插入图片描述
术语
根节点(root node):最顶端的节点;
决策节点(decision nodes):所有决定下一步走向的节点,包括根节点;图中所有椭圆节点;
叶子结点(leaf nodes):树最底端的节点,给出预测结果的节点;图中所有矩形节点。

1.2 学习过程

决策1:如何在每个节点处选择合适的特征/属性(How to choose what feature to split on at each node)?
纯度最大化/最小化(Maximize or minimize purity):比如第一个节点,有三种可能的特征,但只有选择耳朵形状时,节点所分出的两个分类中,猫的占比分别最大和最小;因此选耳朵形状作为该节点的特征。
决策2:什么时候停止划分(When do you stop splitting)?

  1. 当节点获得了100%的分类结果(When a node is 100% one class);
  2. 当划分节点会导致超过树的最大深度(When splitting a node will result in the tree exceeding a maximum depth);
  3. 当纯度值的增长低于一定阈值(When improvements in purity score are below a threshold);
  4. 当节点中案例数量低于一定阈值(When number of examples in a node is below a threshold)。
2.1 纯度(Measuring purity)

——衡量纯度的概念(Entropy as a measure of impurity)
在这里插入图片描述
如图,p1指代一组分类结果中猫的占比(剩下的是狗);H(p1)是熵;图中为熵与p1的关系;可见熵随着纯度的增大呈现先增大后减小的趋势;在p1=0.5时(如,3个猫3个狗)熵达到最大值1,在p1分别为0(6个狗)和1(6个猫)两个端点时,熵最小,值为0。
图中熵函数的公式:
首先定义集合中除了猫之外的小动物占比:
p 0 = 1 − p 1 {p_0} = 1 - {p_1} p0=1p1
熵函数:
H ( p 1 ) = − p 1 log ⁡ 2 ( p 1 ) − p 0 log ⁡ 2 ( p 0 ) H\left( { {p_1}} \right) = - {p_1}{\log _2}\left( { {p_1}} \right) - {p_0}{\log _2}\left( { {p_0}} \right) H(p1)=p1

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值