【发布时间】:2019-06-05 10:39:25
【问题描述】:
我在 java 中有一个 Dataset<Row>。我需要读取作为 JSON 字符串的 1 列的值,对其进行解析,然后根据解析的 JSON 值设置其他几列的值。
我的数据集如下所示:
|json | name| age |
========================================
| "{'a':'john', 'b': 23}" | null| null |
----------------------------------------
| "{'a':'joe', 'b': 25}" | null| null |
----------------------------------------
| "{'a':'zack'}" | null| null |
----------------------------------------
我需要这样:
|json | name | age |
========================================
| "{'a':'john', 'b': 23}" | 'john'| 23 |
----------------------------------------
| "{'a':'joe', 'b': 25}" | 'joe' | 25 |
----------------------------------------
| "{'a':'zack'}" | 'zack'|null|
----------------------------------------
我想不出办法。请帮忙写代码。
【问题讨论】:
标签: java apache-spark apache-spark-dataset