【问题标题】:How to convert Mahout VectorWritable to Vector in Spark如何在 Spark 中将 Mahout VectorWritable 转换为 Vector
【发布时间】:2015-10-22 12:52:09
【问题描述】:

我有一个来自 Mahout 生成的序列文件的 VectorWritable (org.apache.mahout.math.VectorWritable),我想将其转换为 Vector (org.apache.spark.mllib.linalg.Vectors) 类型是 Spark。我如何在 Scala 中做到这一点?

【问题讨论】:

    标签: scala apache-spark mahout apache-spark-mllib


    【解决方案1】:

    假设我们有来自您的previous questionRDD[(Text, VectorWritable)]

    import scala.collection.JavaConverters.iterableAsScalaIterableConverter
    
    def mahoutToScala(v: org.apache.mahout.math.VectorWritable) =  {
        val scalaArray = v.get.all.asScala.map(_.get).toArray
        org.apache.spark.mllib.linalg.Vectors.dense(scalaArray)
    }
    
    rdd.map{ case (k, v) => (k.toString, mahoutToScala(v))}
    

    【讨论】:

      猜你喜欢
      • 2015-10-28
      • 1970-01-01
      • 1970-01-01
      • 2012-03-15
      • 2017-06-02
      • 2018-03-23
      • 1970-01-01
      • 2018-08-26
      • 2012-03-02
      相关资源
      最近更新 更多