【发布时间】:2019-09-20 11:31:59
【问题描述】:
我有以下同义词扩展:
suco => suco, refresco, bebida de soja
我想要以这种方式标记搜索:
搜索“suco de laranja”将被标记为 ["suco", "laranja", "refresco", "bebida de soja"]。
但我将其标记为 ["suco"、"laranja"、"refresco"、"bebida"、"soja"]。
考虑到“de”这个词是一个停用词。我希望它在查询中被忽略,例如“bebida de laranja”变成[“bebida”,“laranja”]。但我不希望在同义词标记化中考虑它,因此“bebida de soja”仍然作为一个标记“bebida de soja”。
我的设置:
{
"settings":{
"analysis":{
"filter":{
"synonym_br":{
"type":"synonym",
"synonyms":[
"suco => suco, refresco, bebida de soja"
]
},
"brazilian_stop":{
"type":"stop",
"stopwords":"_brazilian_"
}
},
"analyzer":{
"synonyms":{
"filter":[
"synonym_br",
"lowercase",
"brazilian_stop",
"asciifolding"
],
"type":"custom",
"tokenizer":"standard"
}
}
}
}
}
【问题讨论】:
标签: elasticsearch elastic-stack elasticsearch-5