【发布时间】:2017-10-21 16:16:05
【问题描述】:
这是我调用 Sparklyr 会话后的当前方式:
dbGetQuery(sparkContext, "USE DB_1")
df_1 <- tbl(sparkContext, "table_1")
dbGetQuery(sparkContext, "USE DB_2")
df_2 <- tbl(sparkContext, "table_2")
df <- df_1 %>% inner_join(df_2, by = c("col_1" = "col_2"))
nrow(df))
我遇到的错误:
"Error: org.apache.spark.sql.AnalysisException: Table or view not found: table_1"
我认为 Sparklyr 不(直接)支持从 2 个数据库连接表。我想知道是否有人对这个问题有一个优雅的解决方案
【问题讨论】:
-
你试过 tbl_cache(sc, name, force = TRUE) 吗?例如:my_var