【问题标题】:How to display pivoted dataframe with PySark, Pyspark? [duplicate]如何使用 PySpark、Pyspark 显示枢轴数据框? [复制]
【发布时间】:2017-06-13 04:20:07
【问题描述】:

我无法使用 PySpark 显示/显示/打印旋转数据框。尽管数据框似乎已被旋转,但当我尝试在其上使用 show() 时,它显示AttributeError: 'GroupedData' object has no attribute 'show'

这是代码

meterdata = sqlContext.read.format("com.databricks.spark.csv").option("delimiter", ",").option("header", "false").load("/CBIES/meters/")

metercols = meterdata.groupBy("C0").pivot("C1")
metercols.show()  


Output:  Traceback (most recent call last): File "/tmp/zeppelin_pyspark-8003809301447367155.py", line 239, in eval(compiledCode) File " ", line 1, in AttributeError: 'GroupedData' object has no attribute 'show'

【问题讨论】:

    标签: python apache-spark pyspark apache-spark-sql spark-dataframe


    【解决方案1】:

    pivot() 方法返回一个 GroupedData 对象,就像groupBy()。如果不使用聚合函数(例如 sum() 甚至 count()),则不能在 GroupedData 对象上使用 show()

    请参阅this articlePySpark documentation 了解更多信息。

    【讨论】:

      猜你喜欢
      • 2022-01-19
      • 1970-01-01
      • 2023-03-31
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-04-09
      • 1970-01-01
      相关资源
      最近更新 更多