【问题标题】:Pentaho: add another column based on another columnPentaho:基于另一列添加另一列
【发布时间】:2018-01-04 08:08:33
【问题描述】:

我有这种情况,我有关于年龄的数据,我想添加另一个年龄范围

  • 范围 1(0-18 岁)= 儿童;
  • 范围 2 (19-50) = 成人;
  • 范围 3 (50+) 老年人

如何在 Pentaho 中做到这一点?我已经尝试过使用过滤器等,但我没有成功。所以我想有一个如下图所示的输出(大约 100k 行,所以我不能手动完成)。

目标数据[AgeRang 列添加]:

【问题讨论】:

    标签: pentaho etl kettle pentaho-data-integration


    【解决方案1】:

    您要查找的步骤名为Number range

    【讨论】:

      【解决方案2】:

      我会使用一个名为User Defined Java Expression 的步骤,它使用Java expression 过滤数据并添加新列age_range 来记录流的行。

      Java expression 字段中使用此语句:

      • (age <= 18) ? 1 : (age <= 50) ? 2 : 3

      从执行中检查下图:

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2016-12-21
        • 2021-04-15
        • 1970-01-01
        • 2020-11-22
        • 1970-01-01
        • 2020-05-07
        相关资源
        最近更新 更多