【问题标题】:Out of memory error while running spark submit运行火花提交时出现内存不足错误
【发布时间】:2020-07-03 09:09:48
【问题描述】:

我正在尝试将 60gb 表数据加载到 spark python 数据帧中,然后将其写入配置单元表中。

我已将驱动程序内存、执行程序内存、最大结果大小设置为足以处理数据。但是当我使用命令行中提到的所有上述配置运行 spark submit 时,我遇到了错误。

注意:通过 spark python shell(通过在启动 shell 时指定驱动程序和执行程序内存),我能够填充目标 hive 表。

有什么想法吗??

【问题讨论】:

    标签: apache-spark hadoop pyspark hive bigdata


    【解决方案1】:

    尝试使用语法:

    ./spark-submit --conf ...

    用于内存相关的配置。我怀疑您正在做的是-您正在设置它们,同时初始化SparkSession-这变得无关紧要,因为那时内核已经启动。与您为运行 shell 设置的参数相同。

    https://spark.apache.org/docs/latest/submitting-applications.html

    【讨论】:

      猜你喜欢
      • 2016-10-20
      • 1970-01-01
      • 1970-01-01
      • 2018-04-20
      • 1970-01-01
      • 1970-01-01
      • 2017-11-24
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多