bm25 是什么?
bm25 是一种用来评价搜索词和文档之间相关性的算法,它是一种基于概率检索模型提出的算法,再用简单的话来描述下bm25算法:我们有一个query和一批文档Ds,现在要计算query和每篇文档D之间的相关性分数,我们的做法是,先对query进行切分,得到单词qiq_i,然后单词的分数由3部分组成:

单词qiq_i和D之间的相关性
单词qiq_i和D之间的相关性
每个单词的权重

最后对于每个单词的分数我们做一个求和,就得到了query和文档之间的分数。
经典检索算法:BM25算法
经典检索算法:BM25算法
经典检索算法:BM25算法

参考:https://www.jianshu.com/p/53e379483f3e
https://www.jianshu.com/p/1e498888f505

相关文章:

  • 2019-11-14
  • 2022-01-21
  • 2022-12-23
  • 2021-11-23
  • 2022-12-23
  • 2022-12-23
  • 2022-01-09
猜你喜欢
  • 2022-12-23
  • 2022-01-11
  • 2021-12-13
  • 2021-12-21
  • 2021-12-15
  • 2022-12-23
  • 2022-01-05
相关资源
相似解决方案