【问题标题】:How to perform conditional de-duplication in talend如何在talend中执行条件重复数据删除
【发布时间】:2020-03-15 12:35:43
【问题描述】:

我有一个包含员工 ID、姓名和最后生效日期的表格。我只想保留具有 max(last effective date) 的员工 ID,并丢弃其他具有较早最后生效日期的重复员工 ID 行。

我正在尝试使用tAggregatetFilterRow 来实现这一点。我尝试使用tAggregate 执行计数,但它没有捕获 max(lasteffectivedate)。

【问题讨论】:

    标签: talend talend-mdm


    【解决方案1】:

    使用 tAggreggateRow 您可以:

    如果您也想获取 ID,则需要在 tMap(主分支)中重用您的主要流程,并将具有 tAggregateRow 的流程放在 tMap 的查找中。 之后,您在名称和日期上进行连接。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2015-03-13
      • 1970-01-01
      • 2021-04-02
      • 1970-01-01
      • 2015-05-16
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多