【发布时间】:2017-01-22 08:38:23
【问题描述】:
我有一个 pyspark 数据框作为
DOCTOR | PATIENT
JOHN | SAM
JOHN | PETER
JOHN | ROBIN
BEN | ROSE
BEN | GRAY
并且需要按行连接患者姓名,以便获得如下输出:
DOCTOR | PATIENT
JOHN | SAM, PETER, ROBIN
BEN | ROSE, GRAY
有人可以帮我在 pyspark 中创建这个数据框吗?
提前致谢。
【问题讨论】:
标签: python apache-spark pyspark