【发布时间】:2016-07-17 01:39:21
【问题描述】:
我使用这些设置(以及其他设置)启动了一个 spark 作业:
spark.driver.maxResultSize 11GB
spark.driver.memory 12GB
我正在调试我的 pyspark 工作,它一直给我错误:
serialized results of 16 tasks (17.4 GB) is bigger than spark.driver.maxResultSize (11 GB)
所以,我在配置设置中将spark.driver.maxResultSize 增加到18 G。而且,它奏效了!!
现在,这很有趣,因为在这两种情况下,spark.driver.memory 都比返回的序列化结果SMALLER。
为什么允许这样做?我假设这是不可能的,因为我在调试时序列化的结果是17.4 GB,比驱动程序的大小更大,即12 GB,如上所示?
这怎么可能?
【问题讨论】:
-
只是好奇 - 为什么投反对票?
标签: apache-spark jvm buffer cluster-computing pyspark