【发布时间】:2017-10-07 19:55:56
【问题描述】:
查看一些示例火花代码,我看到重新分区或合并中的数字是硬编码的:
val resDF = df.coalesce(16)
管理此参数的最佳方法是什么,当集群可以在几秒钟内动态变为updated 时,此硬编码值变得无关紧要。
【问题讨论】:
-
你是说内部Spark代码?不是你的?
-
对不起,我的意思是开发人员提供的示例火花代码。
标签: apache-spark distributed-computing partition