【问题标题】:Combing Multiple RDD's in scala在scala中组合多个RDD
【发布时间】:2016-08-31 03:50:13
【问题描述】:

我有 4 个 RDD[Double,Double] 类型的数据。 我想将它们连接在一起并想要 RDD[Double, (Double,Double,Double,Double)] 类型的输出,但是使用连接函数我得到的输出为 RDD[Double, (((Double,Double),Double),双倍的)]。 这里只是想明确每个数据中的第一个值是相同的。

【问题讨论】:

    标签: scala apache-spark rdd


    【解决方案1】:

    只需将值映射到预期类型:

    val original: RDD[Double, (((Double,Double),Double),Double)] = // ...
    val res: RDD[Double, (Double,Double,Double,Double)] = 
      original.mapValues { case (((d1, d2), d3), d4) => (d1, d2, d3, d4) }
    

    【讨论】:

    • 您好,感谢您的回答,我需要将此 RDD[(Double,(Double,Double,Double,Double)] 转换为标记数据,以便在此上拟合物流模型。您能帮忙吗?
    • 发布一个新问题。我或其他人可能会提供帮助:)
    猜你喜欢
    • 2023-04-07
    • 2018-12-31
    • 2015-10-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-06-22
    • 2013-12-08
    相关资源
    最近更新 更多