loujiang

把文本转换为一个个的单词,分词称之为analysis。es默认只对英文语句做分词,中文不支持,每个中文字都会被拆分为独立的个体。

英文分词:I a nice boy
中文分词:我是一个好男孩
Elasticsearch 有5种分词

standard:默认分词,单词会被拆分,大小会转换为小写。

simple:按照非字母分词。大写转为小写。

whitespace:按照空格分词。忽略大小写。

stop:去除无意义单词,比如the/a/an/is…
![](https://img2020.cnblogs.com/blog/240766/202004/240766-20200412184511833-1640452744.png
keyword:不做分词。把整个文本作为一个单独的关键词。

文档中某个字段分词

分类:

技术点:

相关文章:

  • 2021-12-22
  • 2021-11-25
  • 2021-10-23
  • 2021-12-07
  • 2021-07-18
猜你喜欢
  • 2021-10-28
  • 2022-02-05
  • 2022-01-16
  • 2021-02-08
  • 2019-01-01
  • 2021-11-24
  • 2021-05-19
相关资源
相似解决方案