【发布时间】:2017-08-19 18:34:44
【问题描述】:
我有 2 个 rdd,一个作为字典列表,第二个作为元组列表,如下所示 -
rdd1 = [{'id1', ['string', 'string', count]}, {'id2', ['string', 'string', count]}, {'id3', ['string ', '字符串', 计数]}] rdd2 = [(id1, count), (id2, count), (id3, count)]
如果 rdd2 中的 id 与 rdd1 匹配,现在我想将 rdd2 的计数添加到 rdd1。 你能帮我实现这个吗?
提前谢谢你。
【问题讨论】:
标签: list dictionary tuples pyspark rdd