学习曲线是一条关于样本个数和经验损失函数之间的曲线,对机器学习中的过程进行判断,进一步调整学习参数,提高假设模型的泛化能力。
在上面的图中,蓝线表示经验损失函数随着训练样本的增多而变大,相反绿线呈现出反向的关系。绿线是交叉验证样本,计算交叉验证的样本损失函数使用到的权值参数是由训练样本得到的,与该权值参数保持一致。
从图中可以看出无论是蓝线还是绿线,损失函数值都很高,这种现做象叫“偏量(bias)”。
相对于另一种情况:
蓝线和绿线的损失函数值都挺小,但两线的间隔始终存在,这种现象叫做“方差(variance)”

学习曲线是评估机器学习模型性能的重要工具,它反映了经验损失函数随样本数量的变化。过高损失值可能表示偏量(欠拟合),需要增加模型复杂度;而损失值虽小但训练与验证损失差距大则暗示过拟合,可通过增加样本、减少特征或正则化处理来改善。增大样本量仅对缓解过拟合有效。

5818

被折叠的 条评论
为什么被折叠?



