【发布时间】:2015-08-14 16:21:56
【问题描述】:
我正在研究 spark,而不是 scala 专家。我有地图功能的两种变体。你能解释一下它们之间的区别吗?
第一个变体和已知格式。
第一个变种
val.map( (x,y) => x.size())
第二个变体 -> 这已应用于元组
val.map({case (x, y) => y.toString()});
val 的类型是RDD[(IntWritable, Text)]。当我尝试使用第一个函数时,它给出了如下错误。
类型不匹配; 发现:(org.apache.hadoop.io.IntWritable,org.apache.hadoop.io.Text)⇒单位 必需:((org.apache.hadoop.io.IntWritable, org.apache.hadoop.io.Text)) ⇒ 单位
当我添加额外的括号时,它说,
元组不能在方法或函数参数中直接解构。
【问题讨论】:
-
第一个变体是两个参数的函数,第二个是一个参数的函数,应该是一个元组。
标签: scala apache-spark