【问题标题】:Is it possible use several fields to use for similarity in MoreLikeThis while using ContentStreams?在使用 ContentStreams 时,是否可以使用多个字段用于 MoreLikeThis 中的相似性?
【发布时间】:2017-08-24 22:54:24
【问题描述】:

假设我正在使用 MoreLikeThisHandler 和外部提供的相似性文本,即“土豆”,并与我的文档的“标题”和“描述”字段进行比较。所以我会有这样的网址:

http://localhost:8983/solr/my_collection/mlt?stream.body=potato&mlt.fl=title,description

&mlt.interestingTerms=details检查结果我发现只有第一个指定的字段“title”被用于提取interestingTerms。更改 URL 中指定字段的顺序会导致第一个字段仍用于 mlt 匹配“描述”。提供多个单词的文本时,此行为不会改变。

考虑到 Solr Wiki 中的示例还显示了使用 ContentStreams 进行 mlt 相似性查询的两个字段,是否真的可以为此使用多个字段? (“manu”和“cat”字段,https://wiki.apache.org/solr/MoreLikeThisHandler

我已经有enableRemoteStreaming="true"

(实际上,我不会将文本发布到流正文以获取类似文档,而是使用 stream.url 从 URL 流式传输文档)

【问题讨论】:

    标签: solr lucene morelikethis


    【解决方案1】:

    这是 Solr 7.4 之前版本的一个限制,它已在 7.4 中修复,并且应该可以在该版本或更高版本中实现。欲了解更多信息,请参阅https://issues.apache.org/jira/browse/SOLR-5351

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2013-02-24
      • 1970-01-01
      • 2012-07-08
      • 1970-01-01
      • 2018-10-31
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多