【问题标题】:How to select the column values of sparkR data frame?如何选择 sparkR 数据框的列值?
【发布时间】:2015-07-22 06:05:28
【问题描述】:

我创建了一个 sparkR 数据框,人们

+----+-------+
| age|   name|
+----+-------+
|20.0|Michael|
|30.0|   Andy|
|19.0| Justin|
+----+-------+

如何在“年龄”列中选择第一个值。在 R 语言中,我们可以通过 people$age[1] 执行,结果为 20.0。我们如何在 sparkR 数据帧中做同样的事情。

TIA, 阿伦

【问题讨论】:

    标签: apache-spark apache-spark-sql sparkr


    【解决方案1】:

    在 SparkR 中,您首先拥有该功能,该功能仅适用于 DataFrame,不适用于列。因此你可以这样做

    first(people)$age
    

    这仅适用于第一项。 SparkR DataFrame 没有行索引,但是您可以使用 head 或 take 来决定要获取多少项:

    head(people, 5)$age
    take(people, 5)$age
    

    但是没有办法只取第五个元素。

    【讨论】:

    • 如果我想在 sparkr 的数据框中使用 [1:2] 怎么办
    猜你喜欢
    • 1970-01-01
    • 2015-12-16
    • 2015-12-25
    • 1970-01-01
    • 1970-01-01
    • 2019-03-04
    • 1970-01-01
    • 2016-12-17
    • 1970-01-01
    相关资源
    最近更新 更多