【问题标题】:Is there an equivalent of cbind() or bind_cols() in sparklyr?sparklyr 中是否有等效的 cbind() 或 bind_cols() ?
【发布时间】:2017-08-23 00:01:46
【问题描述】:

我正在尝试在 sparklyR 中绑定两个不同的数据帧(具有相同的行数 - 并且行匹配)的简单操作。

例如:

library(sparklyr)
library(dplyr)

sc <- spark_connect(master = "local[*]")
iris_tbl <- copy_to(sc, iris, name="iris", overwrite=TRUE)

#check column names
colnames(iris_tbl)

#subset iris into two df's
subdf <- iris_tbl %>%
  select(Sepal_Length,Sepal_Width) 

subdf1 <- iris_tbl %>%
  select(Petal_length,Petal_Width,Species)

#try to bind back together
dfCombine <- bind_cols(subdf,subdf1)

我收到的错误消息:

#Error
Error in cbind_all(x) : basic_string::resize

我试过combine()cbind_allcbind()c()。没有一个工作。

【问题讨论】:

标签: r apache-spark spark-dataframe sparklyr


【解决方案1】:

为时已晚,希望对其他人有好处。

要绑定两个不同的数据帧(与 R cbind 相同),我们可以使用 sdf_bind_cols (Sparklyr Reference)

上述问题的代码:

sdf_bind_cols(subdf, subdf1)

【讨论】:

    【解决方案2】:

    尝试使用

    sub2 <- sdf_bind_row(subdf, subdf1)
    

    【讨论】:

    • 根据 Sparklyr 文档,我认为您应该使用 sdf_bind_rows (rows)
    猜你喜欢
    • 2022-07-07
    • 2015-03-12
    • 1970-01-01
    • 2014-09-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-01-08
    相关资源
    最近更新 更多