【发布时间】:2017-08-24 22:54:24
【问题描述】:
假设我正在使用 MoreLikeThisHandler 和外部提供的相似性文本,即“土豆”,并与我的文档的“标题”和“描述”字段进行比较。所以我会有这样的网址:
http://localhost:8983/solr/my_collection/mlt?stream.body=potato&mlt.fl=title,description
用&mlt.interestingTerms=details检查结果我发现只有第一个指定的字段“title”被用于提取interestingTerms。更改 URL 中指定字段的顺序会导致第一个字段仍用于 mlt 匹配“描述”。提供多个单词的文本时,此行为不会改变。
考虑到 Solr Wiki 中的示例还显示了使用 ContentStreams 进行 mlt 相似性查询的两个字段,是否真的可以为此使用多个字段? (“manu”和“cat”字段,https://wiki.apache.org/solr/MoreLikeThisHandler)
我已经有enableRemoteStreaming="true"。
(实际上,我不会将文本发布到流正文以获取类似文档,而是使用 stream.url 从 URL 流式传输文档)
【问题讨论】:
标签: solr lucene morelikethis