【发布时间】:2018-05-10 14:53:21
【问题描述】:
我有一个记录集合,为简单起见如下(逗号分隔):
A1, B1, C1
A1, B1, C1'
A1, B2, C2
当我将它作为 PCollection 通过 Beam 时,我使用 ParDo 将每个映射到一个对象中。现在我想将它们组合成
A1: {
B1: [C1, C1'],
B2: C2
}
对于键值对,我可以使用 GroupByKey,但是如果结构非常嵌套,重复字段可以在每个级别出现怎么办?是否有任何转换来组合重复字段?
【问题讨论】:
标签: apache-beam