【发布时间】:2019-08-11 08:05:52
【问题描述】:
如何强制 Spark 执行对 map 的调用,即使它认为由于其惰性求值而无需执行?
我尝试将cache() 与 map 调用一起使用,但这仍然无法解决问题。我的 map 方法实际上将结果上传到 HDFS。所以,它不是没用的,但 Spark 认为它是。
【问题讨论】:
-
这个问题和your previous one有同样的问题:没有代码可以使用。请发布示例代码。此外,如果这与同一问题有关,请不要提出新问题。
-
这是一个普遍的问题。基本上,如何阻止 Spark 做出假设并执行我给它的任何代码。
-
如果没有您声称它做出假设的代码,我们无法判断 Spark 做出了什么假设。请发布代码。
-
只是出于兴趣,你为什么要这个? Spark 是具有明确理念的 Spark。
标签: java scala hadoop apache-spark