【问题标题】:Phrase search-optimal index settings短语搜索最佳索引设置
【发布时间】:2017-10-27 21:40:52
【问题描述】:

word positionsfast phrase searches 的文档都表明短语搜索的改进。它们在哪里重叠?如果我启用fast phrase searches 并且无意使用cts:near-query,那么word positions 对于简单地优化短语搜索是否是多余的?

【问题讨论】:

    标签: indexing marklogic marklogic-8


    【解决方案1】:

    fast phrase searches 将为您提供两个词短语的准确结果,并且为较长的短语提供比单词搜索更准确的结果。 word positions 也会为您提供更长短语的准确结果。权衡是查看位置需要时间和记忆,所以如果你主要有两个词的短语,fast phrase searches 更好,因为它变成了一个单词查找。

    【讨论】:

    • 如果短语的长度是任意的怎么办?那么单词位置是否会加速构成 N 长度短语的 2 单词短语组合的解析?还是快速短语自己保持位置?
    • word positions 将允许 MarkLogic 解析索引中较长短语的正确顺序,因此即使在搜索 unfiltered 时也可以返回准确的结果。它比过滤搜索更慢,但准确,并且可能更快。
    • @grtjn 如果我用fast phrase searches(而不是word positions)运行unfiltered 搜索短语“the quick brown fox”,听起来这可能会返回误报包含短语“the quick man shot the brown fox”的文档,因为搜索将缺少位置信息来确定“the quick”和“brown fox”是否来自同一个短语。对吗?
    • MarkLogic 将分成 3 个副本:the quickquick brownbrown fox。如果quick brown 出现在不同的位置,例如:the quick man jumped the quick brown dog to shoot the brown fox,则可能会出错。
    猜你喜欢
    • 2012-08-12
    • 1970-01-01
    • 2014-04-04
    • 2012-05-18
    • 1970-01-01
    • 1970-01-01
    • 2012-10-29
    • 2016-03-31
    • 1970-01-01
    相关资源
    最近更新 更多