【发布时间】:2017-02-28 17:48:16
【问题描述】:
我的远程 centos 节点中有 Spark 集群,我想从本地 Windows R 工作室连接那个 远程 Spark 集群(我正在使用 Rstudio Desktop 在我的本地窗口中)
if (nchar(Sys.getenv("SPARK_HOME")) < 1) {
Sys.setenv(SPARK_HOME = "/home/remoteclusterpath/spark-1.6.0-bin-hadoop2.6")
.libPaths(c(file.path(Sys.getenv("SPARK_HOME"), "R", "lib"), .libPaths()))
}
library(SparkR, lib.loc = "/home/remoteclusterpath/spark-1.6.0-bin-hadoop2.6/R/lib")
sc <- sparkR.init(master = "spark://<IP-Address>:7077", sparkEnvir = list(spark.driver.memory="2g"))
我收到以下错误
Error in library(SparkR) : there is no package called ‘SparkR’
请任何人提供解决方案提前谢谢
【问题讨论】:
标签: apache-spark rstudio spark-dataframe sparkr rstudio-server