【发布时间】:2020-09-09 17:32:50
【问题描述】:
我有一个客户正在创建一个搜索应用程序。他们在 Id 字段之外为每个文档都有一个唯一标识符,他们会定期搜索该标识符。该字段恰好包含破折号。我们发现使用此字段唯一搜索给定文档的索引的唯一方法是在其前面加上字段名称并将其括在类似于以下的引号中:
EventId:"TSA-12-01112-15"
换句话说,搜索:
TSA-12-01112-15
或
“TSA-12-01112-15”
返回多个结果,其中由“-”分隔的每个字段段似乎都被分析器作为单独的标记返回。我们正在相关领域使用standard.lucene 分析器。
这是预期的行为吗?有没有办法解决这个问题,以便上面显示的没有字段名称的简单短语搜索将返回预期结果?
【问题讨论】: