【发布时间】:2018-10-05 05:03:05
【问题描述】:
我有一张桌子:
id itemNames 优惠券 有 1 个项目(foo bar)可用,肥皂真 2 项(条)可用 false 3 香皂、洗发水假 4 项 (foo bar, bar) 可用 true 5 项 (foo bar, bar) 可用, (肥皂, 洗发水) true 6 空假
我想把这个炸成
id itemNames 优惠券
1 个项目(foo bar)可用 true
1 肥皂真
2 项(条)可用 false
3 肥皂是假的
3羞耻假
4 项 (foo bar, bar) 可用 true
5 项 (foo bar, bar) 可用 true
6(肥皂、洗发水)是的
6空真
当我这样做时:
df.withColumn("itemNames", explode(split($"itemNames", "[,]")))
我得到了:
itemNames coupons
item (foo bar) is available true
soaps true
item (bar) is available false
soaps false
shampoo false
item (foo bar, true
bar) is available true
(soap, true
shampoo) true
谁能告诉我我做错了什么,我该如何纠正?这里常见的一种模式是逗号出现在 () 中。
【问题讨论】:
标签: scala apache-spark explode