【问题标题】:Why does Azure Search give higher score to less relevant document?为什么 Azure 搜索会为不太相关的文档提供更高的分数?
【发布时间】:2023-02-10 20:44:37
【问题描述】:

我在 Azure 搜索中索引了两个文档(以及许多其他文档):

  • 文档 A 在整个文档中仅包含一个“BRIG”实例。
  • 文档 B 包含 40 个“BRIG”实例。

当我通过 Azure 门户在 Azure 搜索资源管理器中对“BRIG”进行简单搜索时,我看到文档 A 首先返回 "@search.score": 7.93229,然后文档 B 返回 "@search.score": 4.6097126

索引上的评分配置文件为“标题”字段增加了 10 分,为“摘要”字段增加了 5 分,但这并不影响这些结果,因为这两个字段中都没有“BRIG”领域。

还有一个“新鲜度”评分函数,在 365 天内提高了 15 次,具有二次函数配置文件。同样,这不应适用于这些文档中的任何一个,因为它们都是一年多前创建的。

我不明白为什么文档 A 的得分高于文档 B。

【问题讨论】:

    标签: azure search azure-cognitive-search


    【解决方案1】:
    1. 测试您的scoring profile 配置。也许先尝试在不对配置文件评分的情况下发出查询,看看是否满足您的需求。

    2. “searchMode”参数控制精确度和召回率。如果你想要更多的召回,使用默认的“any”值,如果匹配查询字符串的任何部分,它会返回一个结果。如果您喜欢精确,字符串的所有部分都必须匹配,请将 searchMode 更改为“all”。两种方式都尝试上面的查询,看看 searchMode 如何改变结果。参见Simple Query Examples

    3. 如果您使用的是 BM25 算法,您可能还需要调整您的 k1b 值。参见Set BM25 Parameters

    4. 最后,您可能想要探索新的 Semantic search 预览功能以增强相关性。

    【讨论】:

      猜你喜欢
      • 2010-12-22
      • 2020-05-22
      • 2023-02-05
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2010-11-03
      • 2012-02-27
      相关资源
      最近更新 更多