【发布时间】:2019-05-10 08:34:48
【问题描述】:
我有一个 DataFrame,其中有一列“title_from”,如下所示。 。
此列包含一个句子,我想将此列转换为 Array[String]。我尝试过类似的方法,但它不起作用。
val newDF = df.select("title_from").map(x => x.split("\\\s+")
我怎样才能做到这一点?如何将字符串数据帧转换为 Array[string] 数据帧?我希望 newDF 的每一行都是来自 df 的单词数组。
感谢您的帮助!
【问题讨论】:
-
“它不起作用”不是一个足够精确的错误描述,我们无法帮助您。 什么不起作用? 如何不起作用?你的代码有什么问题?您收到错误消息吗?错误信息是什么?你得到的结果不是你期望的结果吗?你期望什么结果,为什么,你得到的结果是什么,两者有什么不同?您正在观察的行为不是期望的行为吗?期望的行为是什么,为什么,观察到的行为是什么,它们有何不同?
-
您对我的描述完全正确。我一定像你说的那样描述过。
标签: scala apache-spark dataframe transformation