【问题标题】:groupBy toList element ordergroupBy toList 元素顺序
【发布时间】:2014-09-14 12:23:26
【问题描述】:

我有一个包含多个字段的 RichPipe,比如说:

'sex
'weight
'age

我需要按 'sex 分组,然后得到一个元组列表('weight 和 'age)。然后我想对每个组的列表进行 scanLeft 操作,并获得一个带有“sex”和“result”的管道。我目前通过这样做来做到这一点

pipe.groupBy('sex) {_.toList('weight -> 'weights).toList('age - 'ages)}

然后将两个列表压缩在一起。我不确定这是最好的方法,而且我不确定列表中值的顺序是否相同,因此当我压缩两个列表时,元组不会与错误混淆价值观。我在文档中一无所获。

【问题讨论】:

    标签: scala hadoop mapreduce cascading scalding


    【解决方案1】:

    好的,看来我已经回答了我自己的问题。

    你可以这样做

    pipe.groupBy('sex) {_.toList[(Int, Int)](('weight, 'age) -> 'list)}
    

    这会产生一个元组列表。如果 Fields API Reference 提到这一点,我会节省很多时间。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2022-08-06
      • 2011-02-07
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-07-07
      相关资源
      最近更新 更多