【发布时间】:2020-02-18 14:19:22
【问题描述】:
我正在使用 java spark,我想知道是否可以转换下面给出的示例数据
Incremental Cost Number | Approver Names
---------------------------------------------------------------------------------
S703401 |Ryan P Cassidy|Christopher J Mattingly|Frank E
LaSota|Ryan P Cassidy|Anthony L Locricchio|Jason Monte
变成这样。
Incremental Cost Number| Approver Names
-------------------------------------------
S703401 | Ryan P Cassidy
S703401 | Christopher J Mattingly
S703401 | Frank E LaSota
S703401 | Ryan P Cassidy
S703401 | Anthony L Locricchio
S703401 | Jason Monte
我导入的文件也是一个逗号分隔的 csv 文件,只是一个特定的列包含多个值,由管道符号分隔。同样,如果我有多个增量成本编号值。
【问题讨论】:
-
嗨@yyy - 你能告诉我们你尝试了什么
-
嗨@mrblewog 我被困在逻辑级别,我不知道如何使用 java spark 继续它。有没有办法使用 RDD 或 Dataset 来做到这一点
标签: java csv apache-spark