【发布时间】:2018-10-31 12:17:02
【问题描述】:
我有一个如下所示的数据集
Dataset<Row> dataset = ...
dataset.show()
| NAME | DOB |
+------+----------+
| John | 19801012 |
| Mark | 19760502 |
| Mick | 19911208 |
我想把它转换成下面的(格式化的DOB)
| NAME | DOB |
+------+------------+
| John | 1980-10-12 |
| Mark | 1976-05-02 |
| Mick | 1991-12-08 |
我该怎么做?基本上,我试图弄清楚如何以通用方式操作现有的列字符串值。
我尝试使用dataset.withColumn,但不知道如何实现。
感谢任何帮助。
【问题讨论】:
-
那些投反对票的人,你能解释一下为什么,以便我以后避免
标签: java scala apache-spark apache-spark-sql apache-spark-dataset