【Precision/Recall的基本概念】


查准率和查全率是信息检索效率评价的两个定量指标,不仅可以用来评价每次检索的准确性和全面性,也是在信息检索系统评价中衡量系统检索性能的重要方面。

(1)查准率(Precision ratio,简称为P),是指检出的相关文献数占检出文献总数的百分比。查准率反映检索准确性,其补数就是误检率。

查准率=(检索出的相关信息量/检索出的信息总量)*100%

(2)查全率(Recall ratio,简称为R),是指检出的相关文献数占系统中相关文献总数的百分比。查全率反映检索全面性,其补数就是漏检率。

查全率=(检索出的相关信息量/系统中的相关信息总量)*100%

【Precision/Recall曲线的来源】

要评价信息检索系统的性能水平,就必须在一个检索系统中进行多次检索。每进行一次检索,都计算其查准率和查全率,并以此作为坐标值,在平面坐标图上标示出来。通过大量的检索,就可以得到检索系统的性能曲线。 
Precision/Recall曲线一般是以每一次计算的查全率为横坐标,每一次计算的查准率为纵坐标。如下图所示: 
Precision/Recall的基本概念 
该图是由100次检索得到的,由图可知:在查全率和查准率之间存在着相反的相互依赖关系–如果提高输出的查全率,就会降低其查准率

相关文章:

  • 2021-08-14
  • 2021-11-27
  • 2022-01-30
  • 2021-11-13
  • 2021-12-05
  • 2021-10-22
  • 2021-06-26
猜你喜欢
  • 2021-05-13
  • 2021-09-17
  • 2021-10-15
  • 2021-12-29
  • 2021-07-28
  • 2022-01-04
  • 2021-04-03
相关资源
相似解决方案