欠拟合、过拟合产生的原因及其解决的方法

本文探讨了机器学习中欠拟合与过拟合的问题,分析了产生的原因及解决方案,包括调整模型复杂度、增加特征、正则化等方法,并详细介绍了深度神经网络中的特殊策略。

欠拟合、过拟合产生的原因及其解决的方法

(一)欠拟合主要产生的原因:模型复杂度过低,无法很好的去拟合所有的训练数据,导致训练误差大
1.增加模型复杂度,尝试使用核SVM、决策树、深度神经网络(DNN)
2.增加新特征,增大假设空间
3.如果有正则项,可以调小正则项参数

(二)过拟合主要产生的原因:模型复杂度过高,训练数据少,训练误差小,但是测试误差大
1.增加训练数据可以有限的避免过拟合
2.正则化,L1、L2;如果有正则项,则考虑增大正则项参数
3.交叉验证
4.特征选择,减少特征数或使用较少的特征组合

(三)深度神经网络(DNN)中常用的方法
1.早停策略:选择合适的epoch,避免过度训练网络,在交叉验证过程中可以观察验证集的loss有没有再减小
2.集成学习策略:对原始M个训练样本进行有放回的随机采用,构建N组M个样本的数据集,然后分别用这N组数据集去训练DNN,最后对模型输出的参数值进行加权平均或者是投票法决定最终输出(会有参数过多的问题存在)
3.DropOut:在模型前向传播或者反向传播的训练过程中,让神经元以一定概率p停止工作,使模型泛化能力强,不至于太过依赖局部的特征。
Dropout
(四)关于L1和L2正则化
正则化方法指的是在进行目标函数和代价函数优化时,在他们后面加上一个正则项

  1. L1正则项会产生稀疏解。
  2. L2正则项会产生比较小的解。
    图左 L2 图右 L1
    参考链接:https://zhuanlan.zhihu.com/p/29707029
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值