【发布时间】:2018-10-03 13:21:16
【问题描述】:
我在弹性搜索中为我的索引使用默认标记器(标准)。并向其中添加文档。但标准分词器无法拆分具有“。”的单词。点在里面。例如:
POST _analyze
{
"tokenizer": "standard",
"text": "pink.jpg"
}
给我的回应是:
{
"tokens": [
{
"token": "pink.jpg",
"start_offset": 0,
"end_offset": 8,
"type": "<ALPHANUM>",
"position": 0
}
]
}
上面的响应显示了一个词中的整个单词。我们可以在标准分词器中使用“.”(点)运算符将其分为两个术语吗?标准标记器中有任何设置吗?
【问题讨论】:
标签: elasticsearch