【发布时间】:2018-01-10 07:57:06
【问题描述】:
我在 Scala 中有一个 CoordinateMatrix 对象。例如,我想添加第 1 行和第 2 行,并将结果存储在第 1 行中。这样做的最佳方法是什么?提前致谢。
【问题讨论】:
标签: scala apache-spark matrix apache-spark-mllib
我在 Scala 中有一个 CoordinateMatrix 对象。例如,我想添加第 1 行和第 2 行,并将结果存储在第 1 行中。这样做的最佳方法是什么?提前致谢。
【问题讨论】:
标签: scala apache-spark matrix apache-spark-mllib
让我帮助您说明有关它的常见想法。
首先,CoordinateMatrix的内部核心数据结构:
case class MatrixEntry(i: Long, j: Long, value: Double)
CoordinateMatrix 只是 RDD[MatrixEntry] 的包装器,带有一些易于使用的接口。
所以你可以用这个类做的是:
构造函数:new CoordinateMatrix(entries: RDD[MatrixEntry])
因此您可以使用(甚至重新散列)合并的 rdd 来提供它的新结构。
【讨论】: