【问题标题】:How to represent a column name with a variable in join of Spark data frame in R?如何在R中的Spark数据框连接中用变量表示列名?
【发布时间】:2021-07-30 07:12:08
【问题描述】:

假设我的数据集中有两列: 数据集表1

Name Eng
A 10
B 20

数据集表2

Name Maths
A 30
B 40

使用 SparkR,

table_merged = join(Table1,Table2,(table1$Name == table2$Name))

但是,如果我将列名存储在变量中

var = "Name"

执行相同操作的等效命令是什么?

【问题讨论】:

  • table1[[var]]==table2[[var]].

标签: r join sparkr


【解决方案1】:

也许更容易使用来自dplyr的“加入”之一

library(dplyr)
var = "Name"
table_merged <- left_join(Table1,Table2, by = var)

【讨论】:

  • 谢谢,这是用于 R 上的 spark 数据帧,因此上述命令不起作用。 table_merged = merge(Table1,Table2, by = var) 类似的命令也可以。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2019-05-12
  • 2018-12-13
  • 1970-01-01
  • 2016-03-04
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多