为什么 Azure 搜索会为不太相关的文档提供更高的分数？答案

【问题标题】：Why does Azure Search give higher score to less relevant document?为什么 Azure 搜索会为不太相关的文档提供更高的分数？
【发布时间】：2023-02-10 20:44:37
【问题描述】：

我在 Azure 搜索中索引了两个文档（以及许多其他文档）：

当我通过 Azure 门户在 Azure 搜索资源管理器中对“BRIG”进行简单搜索时，我看到文档 A 首先返回 "@search.score": 7.93229，然后文档 B 返回 "@search.score": 4.6097126。

索引上的评分配置文件为“标题”字段增加了 10 分，为“摘要”字段增加了 5 分，但这并不影响这些结果，因为这两个字段中都没有“BRIG”领域。

还有一个“新鲜度”评分函数，在 365 天内提高了 15 次，具有二次函数配置文件。同样，这不应适用于这些文档中的任何一个，因为它们都是一年多前创建的。

我不明白为什么文档 A 的得分高于文档 B。

【问题讨论】：

【解决方案1】：

测试您的scoring profile 配置。也许先尝试在不对配置文件评分的情况下发出查询，看看是否满足您的需求。
“searchMode”参数控制精确度和召回率。如果你想要更多的召回，使用默认的“any”值，如果匹配查询字符串的任何部分，它会返回一个结果。如果您喜欢精确，字符串的所有部分都必须匹配，请将 searchMode 更改为“all”。两种方式都尝试上面的查询，看看 searchMode 如何改变结果。参见Simple Query Examples。
如果您使用的是 BM25 算法，您可能还需要调整您的 k1 和 b 值。参见Set BM25 Parameters。
最后，您可能想要探索新的 Semantic search 预览功能以增强相关性。

【讨论】：