【发布时间】:2018-04-27 02:33:05
【问题描述】:
我正在使用 Apache Spark 执行 map-reduce 工作,但映射步骤会生成一个结构,该结构会占用大量内存。在将其他映射对象添加到内存之前,如何让它从内存中减少和删除映射?
我基本上是在做 myrdd.map(f).reduce(r)。但是, f 返回一个非常大的对象,所以我需要运行减速器,然后在太多堆积之前从内存中删除映射的对象。我能以某种方式做到这一点吗?
【问题讨论】:
-
这听起来有点像 XY 问题,但它确实会受益于一些代码,说明问题和语言标签。
标签: apache-spark