【发布时间】:2018-11-21 12:49:32
【问题描述】:
我在elasticsearch中搜索有问题,希望您能帮忙。
我想找到一个关键字标记化的文档,仅由索引中的分析器小写。当生成的术语是搜索查询的一部分时,我希望 Elasticsearch 找到它。
搜索示例:
"query": {
"match": {
"categoryNames": "CD&DVD Aufbewahrung schwarz"
}
}
我要查找的文档:
"_source": {
"categoryId": 11972638,
"categoryNames": [
"DVD-Koffer",
"CD-Koffer",
"CD-Aufbewahrung",
"DVD-Aufbwahrung",
"DVD-Ordner",
"EDV-DVD-Aufbewahrung",
"EDV-CD-Aufbewahrung",
"CD&DVD Aufbewahrung",
"Multimediabox"
],
"lvl3Id": 11972638
}
索引分析器:
"analysis" : {
"analyzer" : {
"default" : {
"type": "custom",
"tokenizer": "keyword",
"filter" : ["lowercase"]
}
}
}
文档的词向量,我要查找的:
"cd&dvd aufbewahrung": {
"term_freq": 1,
"tokens": [
...
]
},
"cd-aufbewahrung": {
"term_freq": 1,
"tokens": [
...
]
},
"cd-koffer": {
"term_freq": 1,
"tokens": [
...
]
},
....
我没有结果。当我仅搜索“CD&DVD aufbewahrung”时,我找到了该文档。
我认为 elasticsearch 试图找到一个不存在的术语“CD&DVD Aufbewahrung schwarz”,而不是匹配“CD&DVD Aufbewahrung”并忽略“schwarz”。
搜索不能使用标准分析器,因为重要的是只有“CD&DVD Aufbewahrung”才能找到“CD&DVD Aufbewahrung”,而不是仅包含“Aufbewahrung”或“Aufbewahrung CD&DVD”的术语,当术语通过例如分析空格。
我对上述文档的期望的一些示例搜索:
CD&DVD Aufbewahrung -> Found
CD&DVD aufbewahrung -> Found
schwarz CD&DVD Aufbewahrung -> Found
CD&DVD Aufbewahrung gelb -> Found
schwarz CD&DVD Aufbewahrung gelb -> Found
CD&DVD schwarz Aufbewahrung -> not Found
Aufbewahrung CD&DVD -> not Found
schwarz CD & DVD Aufbewahrung -> not Found
schwarzCD&DVD Aufbewahrung -> Not Found
有人知道如何解决这个问题吗?
【问题讨论】:
标签: elasticsearch