【问题标题】:Sorting and Grouping on a list of objects对对象列表进行排序和分组
【发布时间】:2020-12-29 18:10:57
【问题描述】:

我有一个如下的过程对象列表

Procedure1  01/01/2020
Procedure2  03/01/2020
Procedure3  03/01/2020
Procedure1  04/01/2020
Procedure5  05/01/2020, 02/01/2020
Procedure2  06/01/2020

我的程序类就像

Class Procedure {
    List<Date> procedureDate;
    String procedureName;
}

我想根据以下条件对对象进行排序和分组。

  1. 应根据过程名称对所有过程进行分组。
  2. 程序必须按程序日期的降序排列。 [日期列表中的第一个元素,即procedureDate.get[0]]
  3. 组合在一起的相同程序应按日期的降序排列。

最终结果必须是,

Procedure2  06/01/2020
Procedure2  03/01/2020

Procedure5  05/01/2020, 02/01/2020

Procedure1  04/01/2020
Procedure1  01/01/2020

Procedure3  03/01/2020

我能够使用 Comparator 和旧的 java 代码来实现这一点。是否可以使用 java8 流、收集器和分组依据来实现相同的目标?

【问题讨论】:

  • 请发布您的“旧”代码,这样我们就不必完全依赖猜测,它还可以通过展示您所做的事情来改善您的问题,而不仅仅是为了某人为你编写所有代码
  • 为什么是 Procedure5 05/01/2020, 02/01/2020 而不是 Procedure5 05/01/2020 Procedure5 02/01/2020
  • @ ΦXocę 웃 Пepeúpa ツ 基本上这个列表来自包含句子的文档。如果句子是“Some Procedure5 occurred on 05/01/2020 and 02/01/2020”,则将有 2 个日期与 Procedure5 相关联。如果句子是“Procendure5 发生在 05/01/2020……几天后,Procendure5 发生在 02/01/2020”,它将是 Procendure5 - 05/01/2020 和 Procedure5 -02/01/ 2020 年(根据业务要求)
  • 你可以使用分组功能,然后对结果进行排序,这样就很容易了

标签: java java-8 java-stream collectors groupingby


【解决方案1】:

我的想法来自基于 map-reduce 的函数式编程。你可以看到 groupBy/collect 实际上是 reduce 的一种形式,这个问题可以更好地“合并”而不是使用 Stream 的 groupBy 功能。这是我在纯 Stream 中的实现。

List<Procedure> a = List.of(
    new Procedure(...),
    ...

)


List<Procedure> b = a.stream().map((p)-> {                    // Prepare for reduce by create Map for each object
        Map<String,Procedure> mapP = new HashMap<>();
        mapP.put(p.getProcedureName(),p)
        return mapP
    }).reduce((p,q)->{                                         //Use reduce to merge
        q.entrySet().stream().forEach((qq)-> {
            if (p.containsKey(qq.getKey())) {
                p.get(qq.getKey()).setProcedureDate(
                    new ArrayList<Date>(
                        Stream.concat(
                            p.get(qq.getKey()).getProcedureDate().stream(),
                            qq.getValue().getProcedureDate().stream())
                        .collect(Collectors.toSet()))
                );
            } else {
                p.put(qq.getKey(), qq.getValue());
            }

        })

        return p;
    }).get().values().stream().map(p-> {                          //sort date inside object
            p.setProcedureDate(p.getProcedureDate().stream().sorted().collect(Collectors.toList()))
            return p;
        }
    ).sorted((x,y)->                                         //sort object by the first date

        x.procedureDate.get(0).compareTo(y.procedureDate.get(0))

    ).collect(Collectors.toList());

【讨论】:

  • 相当令人印象深刻。但是当entrySet().forEach() 会做同样的事情时,entrySet().stream().forEach() 没有任何意义。
  • @Nikolas 我知道.. 但 Stream 被问到.. 所以我回答了
  • 虽然提出了使用Stream API的方案,但不代表没有意义的时候就应该使用。
  • @Nikolas 根据 User_1940878 的说法,“我可以使用 Comparator 和旧的 java 代码来实现这一点。是否可以使用 java8 流、收集器和分组方式来实现相同的目标?”意味着他/她知道如何在没有流的情况下做到这一点。所以我只是用纯粹的流来回答它..
【解决方案2】:

这是一个非常有趣的问题。解决方案并不像看起来那么简单。您必须将解决方案分为多个步骤:

  1. 根据List&lt;Date&gt; 中的第一个日期获取每个分组procedureName 的最大值。
  2. 根据在第一步中创建的Map&lt;String, Date 的最大Date 值比较Procedure 实例。
  3. 如果它们相同,请通过名称区分它们(例如两次 Procedure 2)。
  4. 如果它们仍然相等,请根据实际的第一次日期对 Procedure 实例进行排序。

这里是演示:https://www.jdoodle.com/iembed/v0/Te

第 1 步

List<Procedure> procedures = ...

Map<String, Date> map = procedures.stream().collect(
    Collectors.collectingAndThen(
        Collectors.groupingBy(
            Procedure::getProcedureName,
            Collectors.maxBy(Comparator.comparing(s -> s.getProcedureDate().get(0)))),
    s -> s.entrySet().stream()
        .filter(e -> e.getValue().isPresent())
        .collect(Collectors.toMap(
              Map.Entry::getKey,
              e -> e.getValue().get().getProcedureDate().get(0)))));

.. 解释:有一种简单的方法可以获取Procedure,其中最大的第一个日期按procedureName 分组。

Map<String, Optional<Procedure>> mapOfOptionalProcedures = procedures.stream()
    .collect(Collectors.groupingBy(
             Procedure::getProcedureName,
             Collectors.maxBy(Comparator.comparing(o -> o.getProcedureDate().get(0)))));

然而,返回的结构有点笨拙(Map&lt;String, Optional&lt;Procedure&gt;&gt;),为了使它有用并直接返回Date,需要额外的下游收集器Collectors::collectingAndThen,它使用Function作为结果映射器:

Map<String, Date> map = procedures.stream().collect(
    Collectors.collectingAndThen(
        /* grouping part */,
        s -> s.entrySet().stream()
            .filter(e -> e.getValue().isPresent())
            .collect(Collectors.toMap(
                    Map.Entry::getKey,
                    e -> e.getValue().get().getProcedureDate().get(0)))));

...实际上是第一个sn-p。

步骤 2、3 和 4

基本上,按每个组的最长日期排序。然后按名称排序,最后按实际的第一次日期排序。

Collections.sort(
    procedures,
    (l, r) -> {
        int dates = map.get(r.getProcedureName()).compareTo(map.get(l.getProcedureName()));
        if (dates == 0) {
             int names =  l.getProcedureName().compareTo(r.getProcedureName());
             if (names == 0) {
                 return r.getProcedureDate().get(0).compareTo(l.getProcedureDate().get(0));
             } else return names;
        } else return dates;
    }
);

排序结果

根据您的问题使用已弃用的java.util.Date,排序后的procedures 将具有您预期的sn-p 之类的排序项目(我已经覆盖了Procedure::toString 方法)

@Override
public String toString() {
     return procedureName + " " + procedureDate;
}
Procedure2 [Mon Jan 06 00:00:00 CET 2020]
Procedure2 [Fri Jan 03 00:00:00 CET 2020]
Procedure5 [Sun Jan 05 00:00:00 CET 2020, Thu Jan 02 00:00:00 CET 2020]
Procedure1 [Sat Jan 04 00:00:00 CET 2020]
Procedure1 [Wed Jan 01 00:00:00 CET 2020]
Procedure3 [Fri Jan 03 00:00:00 CET 2020]

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-12-13
    • 2017-02-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多