【发布时间】:2017-09-02 13:44:45
【问题描述】:
library(sparklyr)
library(dplyr)
home <- "/usr/hdp/current/spark-client"
sc <- spark_connect(master = "yarn-client", spark_home = home, version = "1.6.2")
readFromSpark <- spark_read_csv(sc, name="test", path ="hdfs://hostname/user/test.csv",header=TRUE)
我已经使用 sparklyr 成功访问了hdfs。但是如何使用sparklyr 访问配置单元表/命令,因为我需要将此df 存储到配置单元中。
【问题讨论】:
-
试试这个:
df_tbl <- copy_to(sc, readFromSpark, "yourTableName") -
@JaimeCaffarel 我不想把那个 df 作为 df_tbl。我想将 readFromSpark 保存到 hive 表中,我需要创建数据库表,然后我可以将 readFromSpark 放入 hive。
标签: r apache-spark hive sparklyr