【发布时间】:2016-12-27 09:02:19
【问题描述】:
我已经在 spark(scala) 中广播了一个变量,但是由于数据的大小,它给出了这样的输出
WARN TaskSetManager: Lost task 2.0 in stage 0.0 (TID 2, 10.240.0.33): java.lang.OutOfMemoryError: GC overhead limit exceeded
at java.lang.StringCoding$StringDecoder.decode(StringCoding.java:149)
在较小的数据库上运行时,它可以正常工作。我想知道这个广播变量的大小(以 mb/gb 为单位)。有没有办法找到这个?
【问题讨论】:
标签: scala apache-spark size broadcast