【发布时间】:2021-10-18 13:41:39
【问题描述】:
我有一个 (key, value) 对的 PCollection,其中值本身就是一个列表
{'apple': ['1','2'],
'watermelon': ['4','5']
'apple': ['9','10']
}
我想获得另一个具有相同键的集合,但列表是原始集合上的GroupByKey,但结果值是扁平化的。
{'apple': ['1','2','9','10'],
'watermelon': ['4','5']
}
而不是
{'apple': [['1','2], ['9','10']],
'watermelon': [['4','5']]
}
我已经尝试了一些事情,但我不知道如何去做。
我想人们总是可以编写一个ParDo 函数来按每个元素展平列表,但感觉必须有一个更简单的解决方案。
【问题讨论】:
标签: apache-beam