【问题标题】:In "DataFrame API" , how show all rows?在“DataFrame API”中,如何显示所有行?
【发布时间】:2020-11-28 16:57:02
【问题描述】:

我的代码(仅示例)

bikedf.groupBy("Bike #").agg(
    count("Trip ID").alias("number")).\
sort(desc("number")).show()

我使用 jupiter 笔记本。

在某种情况下,结果只显示前 20 行。

如何显示不是 20 行,而是所有行?

【问题讨论】:

标签: dataframe pyspark


【解决方案1】:

使用collect 代替show

print(bikedf.groupBy("Bike #")
            .agg(count("Trip ID").alias("number")
            .sort(desc("number"))
            .collect())

如果你想要漂亮的打印,你可以这样做

output = bikedf.groupBy("Bike #") \
               .agg(count("Trip ID").alias("number") \
               .sort(desc("number"))
output.show(output.count())

【讨论】:

    【解决方案2】:

    您可以设置要显示的行数。您也可以在 show 函数中设置不截断输出设置 False。要显示 200 列:

    bikedf.groupBy("Bike #").agg(
        count("Trip ID").alias("number")).\
    sort(desc("number")).show(200, False)
    

    【讨论】:

      猜你喜欢
      • 2020-12-07
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-11-19
      • 2015-01-05
      • 2023-02-16
      • 2014-10-04
      • 2014-07-17
      相关资源
      最近更新 更多