【发布时间】:2018-05-10 21:45:51
【问题描述】:
我想在两个 H2OFrame 之间进行交叉连接。寻找解决方法严格在 H2OFrame 中
col1.1 <- c('A', 'B', 'E', 'C', 'F', 'D')
dummy <- rep(1,6)
d1.hex <- as.h2o( cbind( col1.1, dummy ) )
col2.1 <- c('xx', 'yy', 'zz', 'ww')
dummy <- rep(1,4)
d2.hex <- as.h2o( cbind( col2.1, dummy ) )
如果我使用 all =TRUE 它会抛出 Error : unimplemented
h2o.merge(d1.hex, d2.hex, all = TRUE)
如果我使用默认,加入结果不是交叉加入
h2o.merge(d1.hex, d2.hex )
虚拟 col1.1 col2.1
1 A xx
1 B xx
1 E xx
1 C xx
1 F xx
1D xx
我尝试将连接列的数据类型更改为分类或数字,但没有成功。寻求您的帮助以解决问题。
谢谢
【问题讨论】:
-
所以我对 h2o 不太熟悉,但这就是您遇到问题的地方。
merge(df1, df2, all = TRUE)似乎是在 R 中交叉加入的正确方法。 -
谢谢@MattW。但我正在寻找 H2OFrame 中的解决方案。从读取文件到进行预测,我正在尝试使用 H2O,我的数据集非常庞大。
标签: r h2o cross-join