1.业务背景:首先搜索的内容要首先完全匹配知识分类,并且按关键字、摘要、其他字段权重依次减低进行查询结果按得分从高到低,并对各个知识分类的查询文档数进行统计

难点:因为每个文档所涉及到的知识分类可能是多个,所以统计的时候,用分类的keyword属性类型进行聚合查询就是不可能实现的

Elasticsearch 知识分类聚合查询以及根据字段权重查询实践

2.首先看一下mapping结构

知识分类属性:File_Clid ,知识关键字 :File_KeyWord ,知识摘要:File_Abstract

Elasticsearch 知识分类聚合查询以及根据字段权重查询实践

首先:要对知识分类File_Clid这个用于聚合的属性,进行分词测试,fielddata:true表示text类型的字段默认禁用开启,如果要对这个字段进行聚合和排序等操作时要开启,加载所对应的的字段的postlist到内存堆中以便进行聚合和排序

因为File_Clid的值可能是多个知识分类所以keyword肯定就排除掉了,然后测试ik_max_word(不合适)

Elasticsearch 知识分类聚合查询以及根据字段权重查询实践

ik_smart分词测试(合适)

Elasticsearch 知识分类聚合查询以及根据字段权重查询实践

standard分词测试(合适)

Elasticsearch 知识分类聚合查询以及根据字段权重查询实践

所以对知识分类File_Clid所用分词器用ik_smart或者standard

3.kibana查询

Elasticsearch 知识分类聚合查询以及根据字段权重查询实践

4.上代码

4.1构建聚合查询条件
@Override
protected AggregationBuilder buildAggs(JSONObject jsonObject) {
    TermsAggregationBuilder field = AggregationBuilders.terms("知识分类").field("File_Clid");
    return field;
}
4.2构建按权重查询的条件
@Override
protected QueryBuilder buildQuery(JSONObject jsonObject) {

    BoolQueryBuilder bool = QueryBuilders.boolQuery();
    Object file_clid = jsonObject.get("File_Clid");
    Object content = jsonObject.get("content");
    if(ObjectUtils.isNotEmpty(file_clid))//分类不为空
        bool.must(QueryBuilders.matchQuery("File_Clid", file_clid.toString()).operator(Operator.AND));
    if(ObjectUtils.isNotEmpty(content)){//查询内容不为空按关键字、摘要、其他属性权重
        QueryStringQueryBuilder queryStringQueryBuilder = QueryBuilders.queryStringQuery(content.toString());
        Map<String,Float> boost = new HashMap<>();
        boost.put("File_KeyWord",5.0f);//关键字
        boost.put("File_Abstract",2.0f);//摘要
        boost.put("File_Title",1.0f);
        boost.put("File_Fun",1.0f);
        boost.put("File_Structure",1.0f);
        boost.put("Principle",1.0f);
        queryStringQueryBuilder.fields(boost);
        bool.must(queryStringQueryBuilder.defaultOperator(Operator.AND));
    }else{//如果查询内容为空展示所有的
        MatchAllQueryBuilder matchAllQueryBuilder = QueryBuilders.matchAllQuery();
        bool.must(matchAllQueryBuilder);
    }
    return bool;
}

4.3查询

SearchRequestBuilder searchRequestBuilder = esTemplate.getClient().prepareSearch(index)
        .setTypes(type);
if(!aggsisnull)
    searchRequestBuilder.addAggregation(aggs);
if(!queryisnull)
    searchRequestBuilder.setQuery(query);
SearchResponse resp = searchRequestBuilder.get(new TimeValue(30 * 1000));

5.为了更直观的看到查询结果,自己写了几个简单丑陋的页面

5.1查询所有{一共插入了7条测试数据,当然文档没有完全显示,截图知识一部分}

Elasticsearch 知识分类聚合查询以及根据字段权重查询实践

5.2.有查询内容且结果文档得分排序

Elasticsearch 知识分类聚合查询以及根据字段权重查询实践

Elasticsearch 知识分类聚合查询以及根据字段权重查询实践

5.3有查询的分类和内容且结果按得分排序

Elasticsearch 知识分类聚合查询以及根据字段权重查询实践

Elasticsearch 知识分类聚合查询以及根据字段权重查询实践

好了,ok!喜欢的可以点个赞哦...

相关文章: