对对象列表进行排序和分组答案

【问题标题】：Sorting and Grouping on a list of objects对对象列表进行排序和分组
【发布时间】：2020-12-29 18:10:57
【问题描述】：

我有一个如下的过程对象列表

Procedure1  01/01/2020
Procedure2  03/01/2020
Procedure3  03/01/2020
Procedure1  04/01/2020
Procedure5  05/01/2020, 02/01/2020
Procedure2  06/01/2020

我的程序类就像

Class Procedure {
    List<Date> procedureDate;
    String procedureName;
}

我想根据以下条件对对象进行排序和分组。

应根据过程名称对所有过程进行分组。
程序必须按程序日期的降序排列。 [日期列表中的第一个元素，即procedureDate.get[0]]
组合在一起的相同程序应按日期的降序排列。

最终结果必须是，

Procedure2  06/01/2020
Procedure2  03/01/2020

Procedure5  05/01/2020, 02/01/2020

Procedure1  04/01/2020
Procedure1  01/01/2020

Procedure3  03/01/2020

我能够使用 Comparator 和旧的 java 代码来实现这一点。是否可以使用 java8 流、收集器和分组依据来实现相同的目标？

【问题讨论】：

请发布您的“旧”代码，这样我们就不必完全依赖猜测，它还可以通过展示您所做的事情来改善您的问题，而不仅仅是为了某人为你编写所有代码
为什么是 Procedure5 05/01/2020, 02/01/2020 而不是 Procedure5 05/01/2020 Procedure5 02/01/2020
@ ΦXocę 웃 Пepeúpa ツ基本上这个列表来自包含句子的文档。如果句子是“Some Procedure5 occurred on 05/01/2020 and 02/01/2020”，则将有 2 个日期与 Procedure5 相关联。如果句子是“Procendure5 发生在 05/01/2020……几天后，Procendure5 发生在 02/01/2020”，它将是 Procendure5 - 05/01/2020 和 Procedure5 -02/01/ 2020 年（根据业务要求）
你可以使用分组功能，然后对结果进行排序，这样就很容易了

标签： java java-8 java-stream collectors groupingby

【解决方案1】：

我的想法来自基于 map-reduce 的函数式编程。你可以看到 groupBy/collect 实际上是 reduce 的一种形式，这个问题可以更好地“合并”而不是使用 Stream 的 groupBy 功能。这是我在纯 Stream 中的实现。

List<Procedure> a = List.of(
    new Procedure(...),
    ...

)


List<Procedure> b = a.stream().map((p)-> {                    // Prepare for reduce by create Map for each object
        Map<String,Procedure> mapP = new HashMap<>();
        mapP.put(p.getProcedureName(),p)
        return mapP
    }).reduce((p,q)->{                                         //Use reduce to merge
        q.entrySet().stream().forEach((qq)-> {
            if (p.containsKey(qq.getKey())) {
                p.get(qq.getKey()).setProcedureDate(
                    new ArrayList<Date>(
                        Stream.concat(
                            p.get(qq.getKey()).getProcedureDate().stream(),
                            qq.getValue().getProcedureDate().stream())
                        .collect(Collectors.toSet()))
                );
            } else {
                p.put(qq.getKey(), qq.getValue());
            }

        })

        return p;
    }).get().values().stream().map(p-> {                          //sort date inside object
            p.setProcedureDate(p.getProcedureDate().stream().sorted().collect(Collectors.toList()))
            return p;
        }
    ).sorted((x,y)->                                         //sort object by the first date

        x.procedureDate.get(0).compareTo(y.procedureDate.get(0))

    ).collect(Collectors.toList());

【讨论】：

相当令人印象深刻。但是当entrySet().forEach() 会做同样的事情时，entrySet().stream().forEach() 没有任何意义。
@Nikolas 我知道.. 但 Stream 被问到.. 所以我回答了
虽然提出了使用Stream API的方案，但不代表没有意义的时候就应该使用。
@Nikolas 根据 User_1940878 的说法，“我可以使用 Comparator 和旧的 java 代码来实现这一点。是否可以使用 java8 流、收集器和分组方式来实现相同的目标？”意味着他/她知道如何在没有流的情况下做到这一点。所以我只是用纯粹的流来回答它..

【解决方案2】：

这是一个非常有趣的问题。解决方案并不像看起来那么简单。您必须将解决方案分为多个步骤：

根据List<Date> 中的第一个日期获取每个分组procedureName 的最大值。
根据在第一步中创建的Map<String, Date 的最大Date 值比较Procedure 实例。
如果它们相同，请通过名称区分它们（例如两次 Procedure 2）。
如果它们仍然相等，请根据实际的第一次日期对 Procedure 实例进行排序。

这里是演示：https://www.jdoodle.com/iembed/v0/Te。

第 1 步

List<Procedure> procedures = ...

Map<String, Date> map = procedures.stream().collect(
    Collectors.collectingAndThen(
        Collectors.groupingBy(
            Procedure::getProcedureName,
            Collectors.maxBy(Comparator.comparing(s -> s.getProcedureDate().get(0)))),
    s -> s.entrySet().stream()
        .filter(e -> e.getValue().isPresent())
        .collect(Collectors.toMap(
              Map.Entry::getKey,
              e -> e.getValue().get().getProcedureDate().get(0)))));

.. 解释：有一种简单的方法可以获取Procedure，其中最大的第一个日期按procedureName 分组。

Map<String, Optional<Procedure>> mapOfOptionalProcedures = procedures.stream()
    .collect(Collectors.groupingBy(
             Procedure::getProcedureName,
             Collectors.maxBy(Comparator.comparing(o -> o.getProcedureDate().get(0)))));

然而，返回的结构有点笨拙（Map<String, Optional<Procedure>>），为了使它有用并直接返回Date，需要额外的下游收集器Collectors::collectingAndThen，它使用Function作为结果映射器：

Map<String, Date> map = procedures.stream().collect(
    Collectors.collectingAndThen(
        /* grouping part */,
        s -> s.entrySet().stream()
            .filter(e -> e.getValue().isPresent())
            .collect(Collectors.toMap(
                    Map.Entry::getKey,
                    e -> e.getValue().get().getProcedureDate().get(0)))));

...实际上是第一个sn-p。

步骤 2、3 和 4

基本上，按每个组的最长日期排序。然后按名称排序，最后按实际的第一次日期排序。

Collections.sort(
    procedures,
    (l, r) -> {
        int dates = map.get(r.getProcedureName()).compareTo(map.get(l.getProcedureName()));
        if (dates == 0) {
             int names =  l.getProcedureName().compareTo(r.getProcedureName());
             if (names == 0) {
                 return r.getProcedureDate().get(0).compareTo(l.getProcedureDate().get(0));
             } else return names;
        } else return dates;
    }
);

排序结果

根据您的问题使用已弃用的java.util.Date，排序后的procedures 将具有您预期的sn-p 之类的排序项目（我已经覆盖了Procedure::toString 方法）

@Override
public String toString() {
     return procedureName + " " + procedureDate;
}

Procedure2 [Mon Jan 06 00:00:00 CET 2020]
Procedure2 [Fri Jan 03 00:00:00 CET 2020]
Procedure5 [Sun Jan 05 00:00:00 CET 2020, Thu Jan 02 00:00:00 CET 2020]
Procedure1 [Sat Jan 04 00:00:00 CET 2020]
Procedure1 [Wed Jan 01 00:00:00 CET 2020]
Procedure3 [Fri Jan 03 00:00:00 CET 2020]

【讨论】：