【发布时间】:2020-10-29 22:43:24
【问题描述】:
我一直在使用 SE 此处发布的问题的出色答案来确定分区的数量以及分区在数据帧中的分布 Need to Know Partitioning Details in Dataframe Spark
有人可以帮我扩展答案以确定数据框的分区大小吗?
谢谢
【问题讨论】:
-
您应该确定分区的数量,而不是确定分区大小。根据文档,推荐的数量是 [2,4] * 核心总数
标签: apache-spark pyspark databricks