【问题标题】:To use sparkR columns使用 sparkR 列
【发布时间】:2015-07-28 10:43:41
【问题描述】:

SparkR Column 提供了一长串有用的方法,例如“isNull”,但在 sparkR 中我在使用它们时遇到了问题。我像这样在 R 中运行 sparkR

cd /home/ole/R/spark-1.4.0 ./bin/sparkR --packages com.databricks:spark-csv_2.10:1.0.3 sqlContext

例如当我输入这个 u=c() isNull(u) 我收到这条消息 (函数(类,fdef,mtable)中的错误: 无法为签名“NULL”找到函数“isNull”的继承方法

【问题讨论】:

    标签: r sparkr


    【解决方案1】:

    这是因为 isNull 需要 DataFrame 的列而不是向量。它检查条目是否为 NULL,它的工作原理如下:

    a   <- createDataFrame(sqlContext,data.frame(b=c("a","b",NA,"c"),c=c(1,2,3,4)))
    a$d <- isNull(a$b)
    collect(a)
    

    它还返回一个(逻辑)列,这就是我将它附加到 DataFrame 的原因。但是您会注意到 SparkR 没有将 NA 存储为 NULL,因此所有逻辑都是 FALSE,但您已经看到该函数是如何工作的。

    【讨论】:

      猜你喜欢
      • 2016-09-21
      • 1970-01-01
      • 2021-05-09
      • 2018-07-12
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-12-19
      • 2017-03-27
      相关资源
      最近更新 更多