【问题标题】:How boost document with distinct content in solr如何在 solr 中提升具有不同内容的文档
【发布时间】:2012-08-15 06:31:02
【问题描述】:

我已经用 Apache Nutch 抓取了一个网站并将其索引到 Solr。我网站的每个页面都有相同的标题,而且结果仅在内容字段中找到。那么我不能像这样提升字段: 内容^0.5 标题^2 因为我的结果完全在内容字段中。在每个页面中都存在一个 h2 html 标记中的短语,如果短语(在 h2 html 标记中)包含搜索它的单词,我想提升文档。我该怎么做?

【问题讨论】:

    标签: solr lucene search-engine dismax


    【解决方案1】:

    您可以使用Edismax(扩展Dismax)解析器根据匹配提升结果。
    它允许根据个人术语匹配(qf 和 qs)、短语匹配与短语 slop(ps 和 ps)和 shingle 匹配(pf2 和 pf2)来增强匹配。
    您可以配置请求处理程序以相应地提升匹配的相关性。

    【讨论】:

      猜你喜欢
      • 2011-03-07
      • 1970-01-01
      • 2014-02-14
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2023-04-01
      • 2011-06-23
      • 2017-03-13
      相关资源
      最近更新 更多