Query Context & Filter Contxt

  • 高级搜索功能 : 支持多项文本输入,针对多个字段进行搜索
  • 搜索引擎一般也提供基于时间,价格等条件的过滤
  • 在Elasticsearch 中,有Query 和 Filter两种不同的Contxt
    • Query Contxt:相关性算分
    • Filter Contxt:不需要算分(Yes or No),可以利用Cache,获得更好的性能

bool查询

  • 一个bool查询,是一个或者多个查询子句的组合
    • 总共包括4种子句。其中2种会影响算分,2种不影响算分
  • 相关性并不只是全文本搜索的专利。也适合于 yes | no 的子句,匹配的子句越多,相关性评分越高。如果多条查询子句被合并为一条复合查询语句,比如bool查询,则每个查询子句计算得分的评分会被合并到总的相关性评分中
    Query&Filtering与多字符串多字段查询

bool查询语法

  • 子查询可以任意顺序出现
  • 可以嵌套多个查询
  • 如果你的bool查询中,没有must条件,should中 必须至少满足一条查询
    Query&Filtering与多字符串多字段查询

如何解决结构化查询 - "包含而不是相等"的问题

  • 解决方案:增加一个 genre count字段进行计数

增加count字段,是用bool查询解决

Filter Context - 不影响算分

Query Context - 影响算分

bool嵌套

Query&Filtering与多字符串多字段查询

查询语句的结构,会对相关度算分产生影响

  • 同一层级下的竞争字段,具有有相同的权重
  • 通过嵌套bool查询,可以改变对算分的影响

控制字段的boosting

  • Boosting是控制相关度的一种手段
    • 索引,字段,或者查询子条件
  • 参数boost的含义
    • 当 boost > 1 时,打分的相关度相对行提升
    • 当 0 < boost < 1 时,打分的权重相对性降低
    • 当 boost < 0 时,贡献负分

相关文章: