【发布时间】:2018-07-08 00:16:54
【问题描述】:
我有一个密集的向量。
scala> model.coefficients
res1: org.apache.spark.ml.linalg.Vector = (891,[11,20,25,27,28,50],[0.35686135501086036,8.194306936725383E-6,7.62720047518819E-6,9.354557510460644E-4,5.633054601656321E-4,2.5641516558812987E-5])
有人可以建议一种方法从这个向量中创建两个数组吗?
数组 1:索引数组
res2: Array[Int] = Array(11,20,25,27,28,50)
数组 2:值数组
res3: Array[Double] = Array(0.35686135501086036,8.194306936725383E-6,7.62720047518819E-6,9.354557510460644E-4,5.633054601656321E-4,2.5641516558812987E-5)
我们将不胜感激您的帮助:
(我的最终目标是获取模型系数并使用索引数组选择列名。例如:数组索引 11 可以是产品 A 的销售额,数组索引 20 可以是客户年龄等等)
【问题讨论】: