机器学习关键概念与算法解析
1. 泛化性能与搜索策略
泛化性能是衡量学习算法的重要指标,它指的是算法所学习的模型在样本外数据上的表现。这一性能的优劣直接关系到模型在实际应用中的效果。
在搜索假设空间时,有一种常用的策略是从一般到具体的搜索。这种搜索方式从最宽泛的假设开始,然后通过不断细化来扩展搜索范围。其流程如下:
1. 确定最一般的假设作为起始点。
2. 根据问题的具体要求和约束条件,对假设进行专业化处理,得到更具体的假设。
3. 重复步骤2,直到找到满足需求的假设或者达到搜索的边界。
2. 生成式与判别式学习
2.1 定义与对比
生成式学习主要有两种分类方式。一种是利用联合概率 $P(y,x)$ 的估计进行分类;另一种是使用先验概率 $P(y)$ 和条件概率 $P(x|y)$ 的估计来完成分类。这里的 $y$ 代表类别,$x$ 是待分类对象的描述。基于这些模型或估计,我们能够从联合分布中生成合成对象。
判别式学习则是在不明确估计 $P(y,x)$、$P(x)$ 或 $P(x|y)$ 的情况下,直接形成 $P(y|x)$ 的模型或估计。常见的判别式方法还包括基于决策函数的方法,这些方法直接将输入 $x$ 映射到输出 $y$,在最小化决策风险时无需估计上述概率。
以下是生成式学习和判别式学习的常见示例对比:
| 学习类型 | 示例算法 |
| ---- | ---- |
| 生成式学习 | 朴素贝叶斯、隐马尔可夫模型 |
| 判别式学习 | 逻辑回归、条件随机场 |
一般认为,当样本稀缺时,生成式学习效果
超级会员免费看
订阅专栏 解锁全文

1874

被折叠的 条评论
为什么被折叠?



