【发布时间】:2017-05-30 03:51:38
【问题描述】:
我有以下数据框,我想仅使用 RDD 进行展平。有人可以帮忙吗?
输入数据框:
+---------+----------+------+-----+- -------------+------------------------------------------------ ------------------+ |TPNB |unitOfMeasure|locationReference|类型|类型|有效日期时间| +---------+----------+------+-----+- -------------+------------------------------------------------ ------------------+ |079562193|EA |0810 |商店|[可出售,持有]|[2015-10-09T00:55:23.6345Z, 2015-10-09T00:55:23.6345Z]| +---------+----------+------+-----+- -------------+------------------------------------------------ ------------------+输出:
TPNB unitOfMeasure locationReference types types effectiveDateTime 079562193 EA 0810 商店出售 2015-10-09T00:55:23.6345Z 079562193 EA 0810 商店举行 2015-10-09T00:55:23.6345Z我正在尝试类似的方法,但似乎不起作用。
final_output.map(value=>((value(0),value(1),value(2),value(3)),value(5),value(6))).map{ case(key,value)=>value.map(records=>(key,records)) }【问题讨论】:
-
final_output.rdd应该给你 rdd 数据,你试过了吗? -
是的,我试过了。它没有工作
-
您在使用 .rdd 时遇到了什么问题?
-
嗨 Ramesh,它只是给了我 IntelliJ 中的语法错误
-
final_output不是数据框吗?
标签: scala apache-spark rdd