【发布时间】:2015-09-11 10:59:33
【问题描述】:
我很好奇将 RDD 传递给 Spark 中的函数究竟做了什么。
def my_func(x : RDD[String]) : RDD[String] = {
do_something_here
}
假设我们如上所述定义了一个函数。当我们调用该函数并传递一个现有的 RDD[String] 对象作为输入参数时,这个 my_function 是否会为这个 RDD 做一个“副本”作为函数参数?换句话说,它是按引用调用还是按值调用?
【问题讨论】:
标签: scala apache-spark rdd