【发布时间】:2017-09-05 20:12:37
【问题描述】:
我有一个带有列的数据框
-
patient_id, -
DOB, -
Gender, -
marital_status, -
smoking_status, city
我需要从 DOB 列中提取年龄,并将新列 age 添加到我的数据框中。如何继续使用 Scala?
【问题讨论】:
-
请提供示例输入数据、预期输出数据帧和您尝试过的代码。
-
是的并添加printSchema的输出,只是为了知道它是一个字符串,一个java.sql.Date还是一个时间戳,thx
-
也许这可以帮助你:Link about UDF solution
标签: scala hadoop apache-spark