【发布时间】:2015-05-25 04:43:31
【问题描述】:
我的 Google 云存储中有以下内容
Advertiser | Event
__________________
100 | Click
101 | Impression
100 | Impression
100 | Impression
101 | Impression
我的管道输出应该类似于
Advertiser | Clicks | Impressions
100 | 1 | 2
101 | 0 | 2
首先我使用了groupByKey,输出是这样的
100 次点击、展示、展示
101 印象,印象
现在可以计算KV的值了吗?
目前我只是使用比较字符串来计算点击次数和展示次数。
这里可以使用计数转换吗?
或者我们在这里使用任何其他转换?
或者我做的方式是唯一的方式?
谢谢, 山姆。
【问题讨论】: