【发布时间】:2016-02-18 06:43:56
【问题描述】:
我知道对于分析字段,Lucene 会将子句标记化,然后将标记存储为倒排索引以进行搜索。但是Lucene如何索引Not_Analyzed字段,我不相信它仍然是倒排索引。是 BTree 还是 Hash?
【问题讨论】:
标签: elasticsearch lucene
我知道对于分析字段,Lucene 会将子句标记化,然后将标记存储为倒排索引以进行搜索。但是Lucene如何索引Not_Analyzed字段,我不相信它仍然是倒排索引。是 BTree 还是 Hash?
【问题讨论】:
标签: elasticsearch lucene
未分析的字段也以与已分析字段相同的方式存储在倒排索引中,它们只是......未分析。这意味着字段值在被索引之前不会被标记化等。
因此,如果您的 not_analyzed 字段包含值 New York,那么该值将在倒排索引中保持不变和未标记化,您仍然可以搜索包含该值的文档准确 价值。这有点类似于有一个分析字段,其分析器是 keyword analyzer
【讨论】: