【发布时间】:2017-12-04 16:51:02
【问题描述】:
我的 Google 云存储中有以下内容
Advertiser | Event
__________________
100 | Click
101 | Impression
100 | Impression
100 | Impression
101 | Impression
我的管道输出应该是这样的
Advertiser | Count
100 | 3
101 | 2
首先我使用了groupByKey,输出是这样的
100 Click, Impression, Impression
101 Impression, Impression
如何从这里开始?
【问题讨论】:
-
请包含您目前拥有的代码的相关 sn-p。
标签: google-cloud-dataflow apache-beam