【发布时间】:2020-11-14 14:27:14
【问题描述】:
我想从 spark 数据框列中的字符串中提取数字字符。
例如
id val (string)
58 [dttg] 201805_mogtca_onvt
91 20050221_frcas
17 201709 dcsevas
我需要:
id a_date year month
58 201805 2018 05
91 20050221 2005 02
17 201709 2017 09
我正在尝试:
df.withColumn('date', DF.to_date(F.col('val').isdigit() # how to get digital chars ?
【问题讨论】:
标签: scala dataframe apache-spark