在很多实际应用中,我们知道仅仅关心正确分类的结果是不够的,并且,在数据偏斜比较严重的情况下,模型准确率可能具有相当程度的误导性,我们也需要知道数据被错误分类的情况,以确认为此需要承担的分类错误的代价。(False Positive假阳性和False Negative假阴性,这两种情况)
查准率(Precision精度):用于描述所有被正确分类的样本中真阳性的比值。
查全率(Recall召回率):真阳性样本的数量与样本集中所包含的全部阳性样本的比值。
分类结果混淆矩阵
|
真实情况 |
||
本文介绍了机器学习中衡量模型性能的重要指标——查准率和查全率,以及它们在数据偏斜时的重要性。查准率关注正确分类中的真阳性比例,查全率关注召回真实阳性的能力。两者之间存在矛盾,提高一方可能导致另一方下降。F1分数用于平衡查准率和查全率,不同场景下可以调整对查准率/查全率的偏好。
在很多实际应用中,我们知道仅仅关心正确分类的结果是不够的,并且,在数据偏斜比较严重的情况下,模型准确率可能具有相当程度的误导性,我们也需要知道数据被错误分类的情况,以确认为此需要承担的分类错误的代价。(False Positive假阳性和False Negative假阴性,这两种情况)
查准率(Precision精度):用于描述所有被正确分类的样本中真阳性的比值。
查全率(Recall召回率):真阳性样本的数量与样本集中所包含的全部阳性样本的比值。
分类结果混淆矩阵
|
真实情况 |
||
1万+
1985

被折叠的 条评论
为什么被折叠?
