From wikipedia.org英文版,我主要将其改变成中文。


  BM25(Best Match25)是在信息检索系统中根据提出的query对document进行评分的算法。It is based on the probabilistic retrieval framework developed in the 1970s and 1980s by Stephen E. RobertsonKaren Spärck Jones, and others.BM25算法首先由OKapi系统实现,所以又称为OKapi BM25。

  

      BM25属于bag-of-words模型,bag-of-words模型只考虑document中词频,不考虑句子结构或者语法关系之类,把document当做装words的袋子,具体袋子里面可以是杂乱无章的。It is not a single function, but actually a whole family of scoring functions, with slightly different components and parameters. One of the most prominent instantiations of the function is as follows.

  对于一个query OKapi BM25 算法介绍, 包括关键字 OKapi BM25 算法介绍, 一个文档的BM25得分:

OKapi BM25 算法介绍
其中IDF是上篇文章《TD-IDF》中的IDF,f是《TD-IDF》中的TF,|D|是文档D的长度,avgdl是语料库全部文档的平均长度。k1和b是参数。usually chosen, in absence of an advanced optimization, as OKapi BM25 算法介绍 and OKapi BM25 算法介绍

相关文章:

  • 2021-07-02
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-12-05
  • 2021-05-20
  • 2021-06-14
猜你喜欢
  • 2021-12-13
  • 2022-12-23
  • 2021-12-21
  • 2022-12-23
  • 2022-12-23
  • 2019-11-14
  • 2022-12-23
相关资源
相似解决方案