一、无序结果评价
1.正确率(Precision)
Precision = 返回结果中的相关文档数 / 返回结果的数目
2.召回率(Recall)
Recall = 返回结果中的相关文档数 / 所有原本相关文档数目
3.F值,是Precision和Recall的调和平均值
F = (β^2+1)PR / (β^2P+R) ,β=1表示正确率和召回率的等权重,β<1表示强调正确率,β>1表示强调召回率。
二、有序结果的评价
1.MAP值(mean average precision,平均正确率值)
这里的“平均”指的是对query的平均。公式如下:

其中,Q是query的集合,mj表示qj对应的所有相关文档的文档数,Rjk表示返回结果中直到遇见文档k(也是相关文档哦!)所在位置前的所有文档集合,也就是说对应的precision在这个集合中来求。这样说比较晦涩,直观一点的说法就是:

本文介绍了信息检索中的结果评价指标,包括无序结果评价的正确率(Precision)、召回率(Recall)和F值,以及有序结果评价的MAP值和NDCG值。重点讲解了这些指标的计算方法和它们如何考虑相关文档的数量、位置以及相关度。NDCG值尤其考虑了文档的相关度和位置,是衡量检索系统性能的重要指标。

1701

被折叠的 条评论
为什么被折叠?



