【发布时间】:2017-07-06 20:11:31
【问题描述】:
我想用特定条件替换列的值。
R 数据框示例:
df <- data.frame(id=c(1:7),value=c("a", "b", "c", "d", "e", "c", "c"))
我想将列值中的值“c”和“d”替换为“e”。
在R中,可以这样做
df[df$value %in% c("c","d"),]$value <- "e"
我尝试在 sparkR 中做同样的事情。尝试了ifelse、when 功能,但无法给我想要的结果。
会不会遇到同样的问题?
【问题讨论】:
-
df$value <- ifelse(df$value %in% c("c","d"), "e", df$value)应该同样适用于Spark DataFrame。 -
它不起作用。我收到一个错误
Error in rep(yes, length.out = length(ans)) : attempt to replicate an object of type 'environment' -
你运行的是什么 spark 版本?
-
我正在运行 spark 1.6
-
我认为这是一个已知的错误,已在 1.6.1 中修复
标签: r apache-spark sparkr