【发布时间】:2018-05-21 22:47:18
【问题描述】:
我是 sparklyr 的新手,我正在尝试将由另一个向量加权的随机法线向量添加到 spark df 的大量列中。这是我用 mtcars 尝试过的一个例子。
library(sparklyr)
library(dplyr)
sc1 <- spark_connect(master = "local")
mtc_df = select(mtcars, vs:carb)
mtc_sdf = sdf_copy_to(sc1, mtc_df, name = "mtc_sdf", overwrite = TRUE)
tf_df <- function(df1){
df1 %>%
mutate_at(vars(am:carb), funs(. + vs * rnorm(32, 100, 1)))
}
tf_df(mtc_df) # works
mtc_sdf %>%
spark_apply(function(d) tf_df(d), memory = TRUE) # doesn't work
我收到以下错误:
Error in file(con, "r") : cannot open the connection
In addition: Warning message:
In file(con, "r") :
cannot open file 'C:\....\filea54a7656c3_spark.log': Permission denied
我也尝试修改 https://spark.rstudio.com/ 上的示例,但得到了同样的错误。
mtc_sdf %>%
spark_apply(function(data) {
data[2:4] + data[1]*rnorm(32*3,100,1)
})
任何帮助将不胜感激。
【问题讨论】:
-
您可以尝试授予对日志目录的完整(或写入)权限吗?这将允许您使用日志并确定问题。
-
感谢您的回复 如何更改 R 中的日志权限 - 我以前没有这样做过? 'add vs' 是什么意思?
-
你能以管理员或root身份执行以查看是否与它有关吗?
标签: r apache-spark apache-spark-sql sparklyr