【发布时间】:2016-12-19 18:21:22
【问题描述】:
我正在尝试将代码从 PySpark 迁移到 SparkR。为了修改一些列,我在 PySpark 中使用了“withColumn”。但是,在 SparkR 中,它会生成一个新列。然后我尝试了类似
df$a <- f(df$a)
这很好。但是,假设我想在函数或 for 循环中使用它并为多个变量重复它。在这种情况下,很遗憾它不起作用:
df[['a']] <- f(df[['a']])
我意识到它在执行以下操作时确实起作用:
df$a <- f(df[['a']])
我绝对需要使用[[<- 或其他方式进行评估。想法?
【问题讨论】:
标签: r apache-spark apache-spark-sql sparkr