【问题标题】:how to decrease storage memory in spark 2.3?如何减少 spark 2.3 中的存储内存?
【发布时间】:2020-11-03 10:53:15
【问题描述】:

我运行 pyspark 作业进行一些转换并将结果保存到 hdfs 中的 orc 文件中,我的 spark conf 是:

   --driver-memory 12G --executor-cores 2 --num-executors 8 --executor-memory 32G ${dll_app_spark_options} --conf spark.kryoserializer.buffer.max=2047 --conf spark.driver.maxResultSize=4g --conf spark.shuffle.memoryFraction=0.7 --conf spark.yarn.driver.memoryOverhead=4096 --conf spark.sql.shuffle.partitions=200

我的工作总是失败,因为 Yarn kill executor for memory(超过内存限制)

执行器和驱动程序的存储内存如下

要保存的DataFrame包含100万行和400列(列数组类型(Float) 我想减少存储内存,我试过 spark.shuffle.memoryFraction=0.7 但它给出了相同的结果 有什么想法吗?

【问题讨论】:

标签: apache-spark pyspark apache-spark-sql


【解决方案1】:

要控制存储内存,您可以使用以下方法

--conf spark.memory.storageFraction=0.1

--conf spark.memory.fraction=0.1

请参考-spark-management-overview

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2015-05-25
    • 2018-11-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-07-31
    • 2022-12-07
    相关资源
    最近更新 更多