【发布时间】:2017-10-18 16:56:09
【问题描述】:
使用 SparkR,我想知道是否可以将 Spark DataFrame 转换为 H2O 框架?
我看到了将 R data.frames 转换为 h2o 帧的示例,但遗憾的是,这不是一个可行的选择(数据大小)。
我知道可以使用 sparklyr 和 rsparkling 创建一个 h2o 框架,但我没有使用 HIVE 或 Hadoop,sparklyr 或 rsparkling。
相反,我的目标是将sdf 从此转换:
set.seed(123)
df<- data.frame(ColA=rep(c("dog", "cat", "fish", "shark"), 4), ColB=rnorm(16), ColC=rep(seq(1:8),2))
sdf<- SparkR::createDataFrame(df)
进入这个:
as.h2o(sdf, destination_frame = "hsdf") # fails, came from Spark (SparkR)
as.h2o(df, destination_frame = "hdf") # succeeds, but this is a regular R data.frame
希望有人找到了一种使用 SparkR 提供的方法来做到这一点。我认为这对 R 用户来说是一个巨大的福音。
【问题讨论】: