【发布时间】:2021-02-02 21:09:59
【问题描述】:
我正在尝试使用 elasticsearch 分析器生成 ngram 功能,特别是,我想在单词中添加前导/尾随空格。例如,如果单词是“2 Quick Foxes”,则带有前导/尾随空格的 ngram 特征将是:
“2”、“2 Q”、.....、“Fox”、“oxe”、“xes”、“es”
PUT my-index-000001
{
"settings": {
"analysis": {
"analyzer": {
"my_analyzer": {
"tokenizer": "my_tokenizer"
}
},
"tokenizer": {
"my_tokenizer": {
"type": "ngram",
"min_gram": 3,
"max_gram": 3,
"token_chars": [
"letter",
"digit"
]
}
}
}
}
}
POST my-index-000001/_analyze
{
"analyzer": "my_analyzer",
"text": "2 Quick Foxes"
}
【问题讨论】:
标签: elasticsearch n-gram