【发布时间】:2021-04-24 02:50:43
【问题描述】:
我在数据框中有一列是字符串数据类型的数组。我需要提取字符串的一部分,因此我需要对数组的每个元素应用正则表达式。 所以我想使用 scala Dataframe API 来应用它。
regexp_extract($"myString","(\\d+)-(\\d+)",1).cast(LongType)
在数组的每个成员上。
在一个字符串上做很简单,但是如何在数组的每一项上做呢?
【问题讨论】:
标签: scala apache-spark apache-spark-sql